每日經濟(ji)新聞(wen) 2025-01-01 22:34:30
每經(jing)記者|鄭(zheng)雨航 實習記者 宋欣悅(yue) 每經(jing)編輯(ji)|蘭素(su)英
長期以來,人工智能(AI)領域奉行“數據(ju)(ju)規(gui)模越大越好”的(de)(de)信念,但近期業界卻傳出(chu)大模型(xing)進化遭遇“數據(ju)(ju)墻”的(de)(de)消息。
據報道,OpenAI、谷歌(ge)和(he)(he)Anthropic在開(kai)發新一代模(mo)型(xing)時遭遇瓶頸,無法(fa)實現此前那樣的突(tu)破性進展。圖靈獎得主楊立昆(kun)(Yann LeCun)和(he)(he)OpenAI前首(shou)席(xi)科學家伊爾亞·蘇茨克維(Ilya Sutskever)等業界(jie)大佬直(zhi)言(yan),規模(mo)法(fa)則(Scaling Law)已觸(chu)及天(tian)花板。
美國(guo)技術研究公司Epoch AI預測(ce),互聯網上可(ke)用的高質量文本數據可(ke)能(neng)會在(zai)2028年耗盡(jin)。
“數(shu)據墻”是否真(zhen)實存在,未來的AI將走向何處?如(ru)果真(zhen)有“數(shu)據墻”,大模(mo)型研發企業又該如(ru)何找尋新的出路?就此(ci),《每(mei)日經(jing)濟新聞》記者(以下簡(jian)稱(cheng)NBD)近日專訪(fang)了清華(hua)大學(xue)計算(suan)機(ji)科學(xue)與技術系長聘副教授崔鵬。
崔鵬表(biao)示,目(mu)前大(da)模(mo)型(xing)還(huan)是以(yi)大(da)規模(mo)數據(ju)驅(qu)動(dong)為范(fan)式的,而數據(ju)總有用完的一(yi)天,肯定會碰(peng)上“數據(ju)墻(qiang)”。在他看來,數據(ju)問(wen)題(ti)只是目(mu)前AI面臨的一(yi)小部分難題(ti)。更大(da)的問(wen)題(ti)在于,目(mu)前的AI缺(que)(que)少(shao)泛化能力(li),使(shi)其缺(que)(que)乏(fa)安全(quan)可信性。
他認為(wei),未來3~5年將是打造(zao)安全、可(ke)信(xin)AI的(de)黃金(jin)期,因為(wei)單純依靠規模法則或者蠻力(li)法(Brute Force,指用大量計(ji)算資源和(he)窮舉所有(you)可(ke)能的(de)方(fang)式(shi)來解決問題),邊際收益已經逐漸降(jiang)低,必須(xu)尋(xun)找新的(de)突破點。
而在談及AI助推行業(ye)升級(ji)的(de)話題時,他表示(shi),我(wo)國(guo)資源稟賦最為突出的(de)領域其實(shi)是工業(ye)。AI與工業(ye)場景相(xiang)結合,反而是我(wo)們很(hen)重要的(de)一步“先手棋”。
崔(cui)鵬(peng)于2010年獲得清華大學博士(shi)學位,長期(qi)聚焦因果推(tui)斷與AI的融合研究,在國(guo)(guo)際(ji)(ji)上自(zi)主提出并(bing)發展(zhan)了(le)因果啟(qi)發的穩定學習理論方(fang)法體系,在智慧醫療、工業制造及互聯(lian)網(wang)經濟等領(ling)域實現(xian)重要應用。崔(cui)鵬(peng)已在AI及數據挖掘(jue)領(ling)域頂(ding)(ding)級國(guo)(guo)際(ji)(ji)期(qi)刊和(he)會議上發表(biao)論文百余篇(pian),并(bing)先后獲得7項國(guo)(guo)際(ji)(ji)會議及期(qi)刊最佳論文獎,還(曾(ceng))擔任IEEE TKDE、IEEE TBD、ACM TIST、ACM TOMM等國(guo)(guo)際(ji)(ji)頂(ding)(ding)級期(qi)刊的編委。
“數據墻”確實存在,AI最大瓶頸是安全可信
NBD:您(nin)認為目前AI發展是(shi)否到了一個瓶(ping)頸?是(shi)否存(cun)在所(suo)謂的(de)“墻”呢?
崔鵬:這(zhe)一(yi)代(dai)AI的技術路徑,總(zong)體上(shang)仍遵循大(da)規(gui)模(mo)數據驅動(dong)的范式(shi),依賴于算法、算力和(he)數據這(zhe)三要素。而目前,基本所有互聯網中的高(gao)質量數據,都已經投喂給(gei)了(le)大(da)模(mo)型。除此之外,大(da)模(mo)型還吸收了(le)大(da)量的人工標注數據。如果(guo)一(yi)直維持(chi)規(gui)模(mo)法則這(zhe)樣的范式(shi),到(dao)一(yi)定階段,AI肯定是會撞上(shang)“數據墻”的。
如果從底層的(de)學習(xi)機理和學習(xi)機制來看,當前AI的(de)泛化能(neng)(neng)力實際上是缺失的(de)。也就(jiu)是說(shuo),AI只能(neng)(neng)處理在(zai)訓練階(jie)段已經見(jian)過的(de)類(lei)似(si)案(an)例,對(dui)于未見(jian)過類(lei)似(si)的(de)案(an)例則難以應對(dui)。
泛化(hua)能(neng)(neng)力(li)的(de)(de)(de)(de)缺失(shi)導致了一個嚴(yan)重的(de)(de)(de)(de)問題:當我們將AI應(ying)用于開(kai)放場景時,模(mo)型往往會在未被充分(fen)訓練過的(de)(de)(de)(de)場景下“胡說(shuo)(shuo)八道(dao)”。這構(gou)成了AI面(mian)臨的(de)(de)(de)(de)最大技(ji)術瓶頸——在安(an)全可(ke)信方面(mian)的(de)(de)(de)(de)能(neng)(neng)力(li)缺失(shi),也(ye)就(jiu)是說(shuo)(shuo),目前的(de)(de)(de)(de)AI既不夠(gou)安(an)全也(ye)不夠(gou)可(ke)信。
NBD:那(nei)我們(men)應該如何(he)解決AI的(de)安全可信問題呢?
崔鵬:目(mu)前來看,有三個層(ceng)面(mian):探索(suo)新的學(xue)習(xi)機理,建立新的數據科(ke)學(xue)體(ti)系,還要(yao)能(neng)夠(gou)提(ti)出新的評(ping)估手段。做(zuo)到三位(wei)一(yi)體(ti),才能(neng)夠(gou)真(zhen)正解決AI的安全和可信(xin)問題。
首先,傳統(tong)的(de)機(ji)器學習基于(yu)“獨立(li)同分布(bu)”的(de)假(jia)設,認為訓練數(shu)據和測試數(shu)據是相似的(de)。這(zhe)種(zhong)假(jia)設給予(yu)機(ji)器學習明確的(de)優化(hua)目標,但在實(shi)際應(ying)用中,這(zhe)種(zhong)假(jia)設可(ke)能會(hui)帶(dai)來一些問(wen)題,比如過擬合(模(mo)型過于(yu)依賴訓練數(shu)據,無法應(ying)對新情況)或擬合無關(guan)的(de)信息。特別(bie)是在大規模(mo)數(shu)據中,變(bian)量之間可(ke)能存在虛假(jia)的(de)關(guan)聯,從而影響(xiang)到模(mo)型的(de)準確性(xing)。相比之下,因果統(tong)計會(hui)更加關(guan)注變(bian)量之間的(de)因果關(guan)系(xi)(即明確哪些因素真正影響(xiang)結果),能夠(gou)更好(hao)地應(ying)對數(shu)據分布(bu)變(bian)化(hua)帶(dai)來的(de)問(wen)題。
其次,我們需要轉變對數(shu)據(ju)(ju)(ju)的處理方式,發展新的數(shu)據(ju)(ju)(ju)科學(xue)體系,從被動積累數(shu)據(ju)(ju)(ju)轉變為主動獲取有效數(shu)據(ju)(ju)(ju),并使數(shu)據(ju)(ju)(ju)與智(zhi)能(neng)形成(cheng)互動的反饋循(xun)環(huan)——數(shu)據(ju)(ju)(ju)產生(sheng)智(zhi)能(neng),智(zhi)能(neng)又能(neng)夠定向告訴我們應該(gai)去產生(sheng)或者收集(ji)什么樣的數(shu)據(ju)(ju)(ju)。
第三是建立(li)新的評估體系,以(yi)準確(que)(que)刻(ke)畫模(mo)(mo)型(xing)的能力邊界(jie)和風險。通過評估來明確(que)(que)模(mo)(mo)型(xing)風險可(ke)能存(cun)在的具體情境,在明確(que)(que)這些風險后,我們就(jiu)應當避免(mian)在那些高風險情境下使用AI模(mo)(mo)型(xing)來完成任務(wu)。
當AI遇上高風險行業,得分99.99也是不夠的
NBD:市面上不乏許(xu)多表現出色(se)的模型(xing),但為何在高風險(xian)行業,仍然(ran)鮮見AI的廣泛應用呢?
崔(cui)鵬:現在關于(yu)AI有(you)兩個(ge)論(lun)調,一種觀點(dian)認為,AI的(de)發展已(yi)經達到(dao)一個(ge)前所未有(you)的(de)高(gao)度,諸(zhu)如AGI(通用人工智(zhi)能(neng))和ASI(超級智(zhi)能(neng))等概(gai)念開始(shi)被廣(guang)泛討(tao)論(lun)。然而,另一種觀點(dian)認為,現在的(de)AI,其(qi)實(shi)(shi)并沒有(you)在嚴肅行業里真正解決(jue)實(shi)(shi)際(ji)問題。
AI在實際應用(yong)中的(de)(de)(de)落(luo)地面(mian)臨諸多(duo)困難,因為AI的(de)(de)(de)泛(fan)化能力無法得(de)到保證,那么(me)其在開放場景(jing)下的(de)(de)(de)安全性和可信(xin)性就無法得(de)到保證。為什么(me)我們敢(gan)用(yong)人去解決(jue)這些風險比較(jiao)高的(de)(de)(de)任務(wu)呢?就是(shi)因為相較(jiao)于現(xian)在的(de)(de)(de)AI,人的(de)(de)(de)可信(xin)性肯定要(yao)高很多(duo)。
對于AI,市面上(shang)有各種各樣(yang)的評(ping)測和榜單,但其實(shi)這些都是對模型整體能(neng)力的刻(ke)畫,但它并不足以精確描繪出模型在具體應(ying)用場景下(xia)的能(neng)力邊界。
那(nei)么,即便(bian)模型拿到99分(fen)(fen),甚(shen)至是(shi)(shi)99.99分(fen)(fen)的高分(fen)(fen),也可(ke)能不(bu)足(zu)以說明(ming)它(ta)在實際應用中是(shi)(shi)安全可(ke)信的。因(yin)為(wei)我們無(wu)法確(que)切知(zhi)曉,其風險(xian)究竟會處于何(he)種情(qing)況之下。因(yin)此,對(dui)于AI而言(yan),確(que)實需(xu)要建立一套新的評估(gu)體系,準確(que)評估(gu)和界定(ding)模型的能力邊界,這一點至關重要。
未來3~5年是打造安全、可信AI的黃金期
NBD:在2024年世界互聯網大會烏鎮峰會網絡安(an)全技(ji)術發展(zhan)與國際(ji)合作論壇上,有(you)業內人士(shi)將AI安(an)全危(wei)機總結為(wei)“三化”,即(ji):黑(hei)箱(xiang)化(指AI系統內部的決(jue)策過(guo)程對用(yong)戶和開發者來說是不透明的)、黑(hei)產化(導(dao)致深度(du)偽造泛濫成災)和武器化(導(dao)致黑(hei)客攻擊(ji)愈演愈烈)。您認(ren)為(wei)在解決(jue)“AI黑(hei)箱(xiang)”的問題上,有(you)哪些比(bi)較有(you)效(xiao)的技(ji)術手(shou)段呢(ni)?
崔鵬:從(cong)技術層(ceng)面來看,AI實際上(shang)正逐步(bu)趨(qu)向于“黑(hei)箱化(hua)”發展。但(dan)是從(cong)性能角度來講,AI的能力也在(zai)不斷增強(qiang)。因(yin)此,在(zai)一定(ding)程度上(shang),可以說我(wo)們讓渡了對模型的控制(zhi)權,換取了其性能上(shang)的提(ti)升(sheng)。
一種新技(ji)術的出現,到底是(shi)(shi)不是(shi)(shi)需(xu)要(yao)它完全透明(ming)、可解(jie)釋,其實也(ye)是(shi)(shi)一個問題。因為(wei)本(ben)質上(shang)來講,一項技(ji)術是(shi)(shi)否能夠為(wei)廣大消費(fei)者所(suo)接受,并(bing)不取決(jue)于它是(shi)(shi)不是(shi)(shi)可解(jie)釋、是(shi)(shi)不是(shi)(shi)透明(ming)的,而(er)取決(jue)于它是(shi)(shi)不是(shi)(shi)安全可信的。
比(bi)如,人(ren)們敢(gan)開車,不是因為每(mei)個(ge)人(ren)都懂(dong)發(fa)動(dong)機的(de)發(fa)動(dong)原理;人(ren)們敢(gan)坐(zuo)飛(fei)機,也不是因為每(mei)個(ge)人(ren)都懂(dong)空氣動(dong)力學。
所謂“可解釋性(xing)”,實際上是(shi)指能夠(gou)被人(ren)類(lei)所理(li)解。而(er)(er)人(ren)類(lei)的解釋邏(luo)輯(ji)往往基于因果。因此,如(ru)果機(ji)器的推理(li)邏(luo)輯(ji)與人(ren)類(lei)的推理(li)邏(luo)輯(ji)能夠(gou)對(dui)齊,那(nei)整(zheng)個工作機(ji)制對(dui)于人(ren)類(lei)而(er)(er)言(yan),就是(shi)可解釋的。
NBD:您(nin)認為我們什(shen)么時候能夠構建好安全可信的AI呢(ni)?
崔鵬:我認為(wei),未(wei)來(lai)3~5年將是打造安全(quan)、可(ke)信AI的黃金期。現在AI又到了(le)一個十字路口,按照(已知)技(ji)術路徑來(lai)走,大(da)家會越來(lai)越清楚AI的最終發展形態。因此,會有更多的人(ren)關注AI的安全(quan)可(ke)信,因為(wei)單純(chun)依靠(kao)規模法則或蠻力法,邊際(ji)收益(yi)已經逐漸降低,必須尋找新(xin)的突(tu)破點。
實(shi)際上,目前已有一些相(xiang)對成熟的(de)技(ji)(ji)術(shu)手段(duan),能夠在一定(ding)程(cheng)度(du)上解決(jue)這(zhe)些問題(ti)。底(di)層的(de)基(ji)礎理論體系已經(jing)構建出來了,關鍵技(ji)(ji)術(shu)也有了,接下來要解決(jue)的(de)就是(shi)如何將這(zhe)些技(ji)(ji)術(shu)與實(shi)際應用場景進行打磨和對齊。因(yin)此我(wo)認為(wei),解決(jue)這(zhe)個問題(ti)所需的(de)時(shi)間并不(bu)會太長(chang)。
但是,在安(an)全(quan)可信的機制這一層面,相對于(yu)歐美國家,我們(men)的投入和(he)關注量都是相對少的。
如(ru)果我們(men)觀察美(mei)國的科研(yan)規(gui)劃或頂尖學者們(men)的研(yan)究方(fang)(fang)向,會(hui)發現他們(men)實際上是“兩(liang)條(tiao)腿在(zai)走”。一方(fang)(fang)面,是靠大(da)規(gui)模(mo)算力、大(da)規(gui)模(mo)數(shu)據來(lai)打造更強大(da)的模(mo)型(xing)。與此同時,他們(men)也(ye)在(zai)積極探(tan)索另(ling)一條(tiao)路,即如(ru)何保障AI的安(an)全性(xing)和可信性(xing)。
“安(an)(an)全可信(xin)”會(hui)是(shi)(shi)2025年AI發展(zhan)的(de)(de)一個重要趨(qu)勢。在當(dang)前階段乃至(zhi)我(wo)國大的(de)(de)戰(zhan)略中(zhong),“安(an)(an)全可信(xin)”都占據著舉足輕(qing)重的(de)(de)地位(wei)。如果這一步棋走好(hao)了,或許(xu)不能說是(shi)(shi)“彎道(dao)(dao)超車”,但(dan)可以說是(shi)(shi)“換道(dao)(dao)超車”。
AI與工業結合,將成為重要的“先手棋”
NBD:AI與自(zi)動化的結合正(zheng)改變一些傳統行業。您認為(wei)AI會(hui)如何(he)推動這些行業的智能(neng)升級呢(ni)?具體的應用場景又(you)會(hui)有(you)哪些呢(ni)?
崔鵬(peng):這(zhe)一波大模型出(chu)來以后,它的(de)主要應用場(chang)(chang)景(jing)是(shi)(shi)互(hu)聯網。但從我(wo)國的(de)資源稟賦講(jiang),互(hu)聯網可(ke)能并不一定是(shi)(shi)最(zui)有比較優勢的(de)“戰(zhan)場(chang)(chang)”。我(wo)國資源稟賦最(zui)為突出(chu)的(de)領域其實是(shi)(shi)工(gong)業。無論(lun)是(shi)(shi)制(zhi)造業的(de)數據量、質量和規(gui)模,還(huan)是(shi)(shi)我(wo)們(men)的(de)支持(chi)力度,都遠超(chao)其他國家。AI與工(gong)業場(chang)(chang)景(jing)相結合,反而是(shi)(shi)我(wo)們(men)很重(zhong)要的(de)一步“先(xian)手棋”。
第四次(ci)工業革(ge)命(ming)的(de)核(he)心在于利用AI解決這(zhe)些嚴肅行(xing)業的(de)生(sheng)產力問題,用智能去賦予工業更高的(de)生(sheng)產效(xiao)率(lv)。
在(zai)此背(bei)景(jing)下(xia),智能化將是一個(ge)必然趨勢(shi)。因為人最不(bu)擅長的(de)就(jiu)是處理大(da)規模、高維度的(de)數據,在(zai)面對復雜任務時,是遠(yuan)遠(yuan)跟不(bu)上需求(qiu)的(de)。而大(da)模型一天(tian)就(jiu)能處理幾十萬(wan)本書(shu)的(de)信息,與人的(de)能力完全不(bu)在(zai)一個(ge)量級(ji)。從這(zhe)個(ge)角(jiao)度來(lai)看(kan),AI是大(da)有可為的(de)。
我們現在正在做的(de)一項工作是通(tong)過分析設備的(de)故(gu)障(zhang)代(dai)碼,利用AI技術(shu)精準定位故(gu)障(zhang)點,大幅度節約人力成本,提高(gao)生(sheng)產(chan)效率。那這(zhe)對于工業(ye)生(sheng)產(chan)而言,無(wu)疑(yi)解決了非常大的(de)問題。
如需轉載請與《每日經濟新聞》報社聯系。
未經(jing)《每日經(jing)濟新(xin)聞》報社授權,嚴禁轉載(zai)或(huo)鏡(jing)像,違者(zhe)必究(jiu)。
讀者熱線(xian):4008890008
特別提醒(xing):如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不(bu)希望作(zuo)品出現在(zai)本站,可聯系我們要求撤下(xia)您的作(zuo)品。
歡迎關注(zhu)每日經(jing)濟新(xin)聞APP