get“模型設(shè)計”新技能
AI自我進(jìn)化了?
“僅需幾行代碼就能構(gòu)建一個回歸模型?!背绦騿T認(rèn)可谷歌AutoML的工作表現(xiàn),認(rèn)為AutoML設(shè)計的模型和機(jī)器學(xué)習(xí)專家設(shè)計的不相上下。日前,谷歌工程師分別在中國和硅谷重點推介谷歌AutoML項目。
不明就里的疑惑緊跟著紛至沓來——AI又進(jìn)化了?!已經(jīng)會自開發(fā)了?能操控自己的進(jìn)化了?是要擺脫人類嗎?
進(jìn)化分幾步
AI確實進(jìn)化了,它能做的事情越來越多,成績斐然。它的背后是AI實現(xiàn)路徑的“三級跳”——
國家超級計算濟(jì)南中心大數(shù)據(jù)研發(fā)部研究員趙志剛說:“起初我們用數(shù)學(xué)公式和‘if……then’等語句告訴計算機(jī)第一步做什么、第二步做什么,手把手地教,后來給機(jī)器n組輸入和輸出,中間的規(guī)則或規(guī)律由它自己學(xué)會。”
“之前,很多聰明的頭腦花一輩子時間研究:如何抽取有效的特征?!睂W⒂谥悄軐?dǎo)購對話機(jī)器人的智能一點公司CTO莫瑜解釋道,“神經(jīng)網(wǎng)絡(luò)算法的發(fā)明、深度學(xué)習(xí)技術(shù)的出現(xiàn),使得AI進(jìn)化到2.0,抽取特征的工作由AI自己進(jìn)行,我們的工作也隨之發(fā)生了變化?!?/p>
用數(shù)學(xué)函數(shù)的模式很容易解釋“1.0”到“2.0”的轉(zhuǎn)變:如果把識別圖像、語義理解、下棋等任務(wù)的達(dá)成都看成是不同的Y=f(X),即輸入的“貓”的圖片、聲音或棋招是“X”,輸出的“貓”、回答、棋高一招是“Y”。深度學(xué)習(xí)之前,人通過自己的分析尋找函數(shù)f對應(yīng)的公式,告訴給AI。而深度學(xué)習(xí)之后,人輸入大量的X與Y的對應(yīng),AI自己發(fā)現(xiàn)函數(shù)f對應(yīng)的公式。
“AI找到的函數(shù)f的具體內(nèi)容,可能比人找到的更好,但是人類并不知道,就像一個黑匣子?!蹦ふf,“但是f的形式是AI研究員通過研究設(shè)計出來的,如果使用深度神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)中的模塊以及模塊之間的組織方式也是提前設(shè)計的?!?/p>
隨著深度學(xué)習(xí)技術(shù)的成熟和普遍化,模型構(gòu)建出現(xiàn)了特定可追尋的經(jīng)驗。“各種共性神經(jīng)網(wǎng)絡(luò)的發(fā)布,使得從業(yè)門檻越來越低。一些普通的模型構(gòu)建與優(yōu)化,剛畢業(yè)的學(xué)生在網(wǎng)上學(xué)學(xué)教程就能上手?!壁w志剛說。
當(dāng)構(gòu)建模型成為可習(xí)得的技能,AutoML就出現(xiàn)了。它能做的正是AI研究員的模型設(shè)計工作?!皩椭煌窘⑷斯ぶ悄芟到y(tǒng),即使他們沒有廣泛的專業(yè)知識。”谷歌工程師這樣推介。AI成功進(jìn)化到3.0。
事實上,AutoML替代的仍舊是人類能夠提煉出經(jīng)驗的工作?!叭绻f之前人描繪一套尋找函數(shù)f的‘路網(wǎng)’,在深度學(xué)習(xí)的技術(shù)輔助下,機(jī)器能最快找到優(yōu)化路徑;那么AI現(xiàn)在可以自己設(shè)計路網(wǎng)了?!壁w志剛言簡意賅。
可以看出,不論是深度學(xué)習(xí)、還是AutoML,都只替代人類的一部分群體已經(jīng)鉆研透了的工作?!皺C(jī)器能做的事情,盡量不要手工勞動”,這是很多程序員的人生信條,這個信條催生了AutoML。本著同樣的信條,微軟開發(fā)了DeepCoder。“它可以用來生成滿足給定輸入輸出的程序。”莫瑜說,但它的表現(xiàn)目前還不盡如人意,只能編寫一些簡單的程序。
誰是“上帝”
答案毫無疑問,人類。
既然AI在進(jìn)化中走向了更高一階的模型設(shè)計,那么“上帝之手”又發(fā)生了哪些變化呢?
“煉丹”,莫瑜用兩個字形象地說起自己的工作,“智能一點是專業(yè)做智能客服的,研發(fā)人員的工作主要集中于問題建模(如何將實際問題轉(zhuǎn)化為人工智能技術(shù)解決的問題)和算法優(yōu)化(如何提升人工智能算法的效果)?!?/p>
“煉”意味著不斷地調(diào)試和完善?!搬槍μ囟ǖ娜?,越投脾氣越好,回答越精準(zhǔn)越好?!蹦ふf,“我們的X是客戶的問話,Y是機(jī)器人客服的回復(fù),中間的函數(shù)f需要訓(xùn)練。”
這是個不容易的任務(wù)。如果把人類社會的經(jīng)驗分為3類:有公式的確定規(guī)則、可言傳的知識、只可意會不可言傳的感覺。最后一類最難琢磨。
“因此,我們想辦法構(gòu)建完善的閉環(huán)反饋,了解特定用戶的喜好,通過情感、趣味的表達(dá),最終做到投其所好?!蹦ふf,“目前處于人機(jī)協(xié)同的工作階段,但是越來越多樣本的獲取,將幫助我們的智能客服給出精準(zhǔn)的、討喜的回答?!?/p>
可見,并不是所有領(lǐng)域都適合交給AI自開發(fā)去做,比如問題建模方面,如何將實際問題抽象轉(zhuǎn)換為機(jī)器學(xué)習(xí)問題, AI還無法自主完成。在AI2.0階段,研發(fā)人員還需要人工設(shè)計函數(shù)f的形式。
那么,AutoML普及的未來會是什么樣?
“人類被從低一級的工作中解放出來?!壁w志剛說,“如果模型設(shè)計可以由AI來做,那么AI研究員將更多地探尋構(gòu)成模型的基礎(chǔ)模塊的設(shè)計?!?/p>
“用AutoML開發(fā)AI模型類似于孩子玩‘樂高’玩具?!壁w志剛深入淺出,“樂高”設(shè)計者把完整的世界拆解成細(xì)致的模塊,萬物可用,進(jìn)而組合成復(fù)雜的模型。而人類更高一級的工作就是針對不同領(lǐng)域為AI找到基礎(chǔ)單元,也就是模塊。如在圖像識別領(lǐng)域,人類已設(shè)計出卷積、池化等多種模塊?!癆utoML才可以以此為依據(jù)進(jìn)行模型構(gòu)建,不停地調(diào)整模塊組合,獲得更符合常理的輸出。模塊越精細(xì)、越能解決通用性問題,自開發(fā)AI越能施展開拳腳。”趙志剛說。
延伸閱讀
產(chǎn)業(yè)需要的人才在哪兒
緩解人才短缺問題是AutoML的主力賣點?!癆I系統(tǒng)正在遍地開花,AI人才卻遠(yuǎn)遠(yuǎn)跟不上?!惫雀璺矫孢@樣解釋AutoML為啥不可或缺。目前的AI人才現(xiàn)狀如何?
2017年,《全球AI領(lǐng)域人才報告》《BAT人工智能領(lǐng)域人才發(fā)展報告》等相繼發(fā)布。“AI人才短缺是真實存在的。”盛世投資集團(tuán)副總裁徐文娟說,“初創(chuàng)期和發(fā)展期企業(yè)人才短缺的問題尤其嚴(yán)重。從目前世界范圍看,美國擁有數(shù)量最多的AI人才,我國AI人才無論從人數(shù)還是從業(yè)經(jīng)驗上都無法與之比擬?!?/p>
趙志剛有相同的感觸:“我國AI領(lǐng)域現(xiàn)在缺老手、缺高手、缺多面手及頂級大師?!蹦P偷膬?yōu)化調(diào)試需要經(jīng)驗,模型的精巧設(shè)計需要高超技藝,把AI應(yīng)用于各個行業(yè)需要復(fù)合型人才,此外,目前引領(lǐng)AI發(fā)展方向的頂級人才屈指可數(shù),且多在國外。
徐文娟介紹,中國的AI人才在BAT(百度、阿里、騰訊)中最多。一般這類人才的背景經(jīng)歷有幾種,海歸、BAT工作經(jīng)驗,或是來自高校或科研院所。
“AI自開發(fā)短期內(nèi)應(yīng)該無法替代人的工作,還有很長的路要走?!毙煳木暾f。趙志剛從學(xué)術(shù)角度分析道:“只有當(dāng)人類把不同應(yīng)用領(lǐng)域的AI模型設(shè)計出來,并進(jìn)一步分解出一系列通用模塊,如同化學(xué)中的元素周期表、生物中的DNA、RNA,這種自開發(fā)才能有更多的應(yīng)用?!?/p>
?
?
相關(guān)鏈接:
星廣互動AR平臺背后:與AI大鱷共同驅(qū)動廣告行業(yè)下一個風(fēng)口?
·凡注明來源為“??诰W(wǎng)”的所有文字、圖片、音視頻、美術(shù)設(shè)計等作品,版權(quán)均屬??诰W(wǎng)所有。未經(jīng)本網(wǎng)書面授權(quán),不得進(jìn)行一切形式的下載、轉(zhuǎn)載或建立鏡像。
·凡注明為其它來源的信息,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)。
網(wǎng)絡(luò)內(nèi)容從業(yè)人員違法違規(guī)行為舉報郵箱:jb66822333@126.com