每日經濟新聞(wen) 2024-12-12 07:21:13
12月11日深(shen)夜,Google發(fa)布(bu)新(xin)模型(xing)Gemini 2.0,直指Agent使用(yong),旨(zhi)在打(da)造能(neng)夠自主理解(jie)、規劃和執行任務的智(zhi)能(neng)助手。此次發(fa)布(bu)包(bao)括Project Astra、Project Mariner、Jules和游戲Agent四(si)大功能(neng),支持多模態輸入(ru)輸出(chu),提(ti)供免費API試用(yong)。
每(mei)經編輯(ji)|畢陸名(ming)
在OpenAI宣布連發12天更新(xin)后,Google選(xuan)擇12月11日深夜(在OpenAI發布更新(xin)之(zhi)前),發布新(xin)模型Gemini 2.0。
在(zai)多次發布(bu)被(bei)OpenAI精(jing)準(zhun)狙擊后,Google扳回一局(ju),發布(bu)了Gemini 2.0,直指Agent使(shi)用(yong)。Agent功能(neng),也稱為智能(neng)體(ti)功能(neng),通常指的是(shi)AI能(neng)夠感知環境、執行任(ren)務(wu)并在(zai)一定程(cheng)度(du)上(shang)獨立(li)做(zuo)出(chu)決策的能(neng)力,也就是(shi)能(neng)更自動(dong)化完成任(ren)務(wu)的功能(neng)。
此次Google似乎(hu)賭對了(le)。OpenAI凌晨兩點(dian)的(de)發布,主要宣布了(le)和(he)Apple Intelligence的(de)合作,一個普遍被期待能與Agent能力強相關的(de)合作。
Google,則(ze)一次(ci)性發(fa)布(bu)了四(si)個(ge)Agent相關的(de)功(gong)能:
Project Astra,能(neng)夠在(zai)Gemini應(ying)用中直接調用Google Lens和地圖(tu)功(gong)能(neng)幫用戶解決問(wen)題;
Project Mariner(海員(yuan)項(xiang)目),Chrome瀏覽器的實驗性功能(neng),可以通(tong)過(guo)提示詞直(zhi)接幫用(yong)戶瀏覽網頁做任務;
Jules,可(ke)以嵌入GitHub的編程Agent,使用自然語言描述問(wen)題,就能直接生成可(ke)以合并到(dao)GitHub項目中的代碼;

游戲(xi)Agent,能夠實時(shi)解讀(du)屏幕畫面,直接在(zai)你(ni)打游戲(xi)的(de)時(shi)候通過(guo)和你(ni)語(yu)音(yin)交(jiao)流,給(gei)你(ni)AI打法(fa)提(ti)示。
據悉,Gemini 2.0 Flash及API免費可用!可以通過Google AI Studio和Vertex AI中的Gemini API使用,基本不要錢,每分鐘最多15個提問,每天最多1500個提問。明年初全面開放。
Gemini 2.0 Flash是2.0家族第一個模型,主推原生多模態輸入輸出+Agent,速度比1.5 Pro快兩倍,關鍵性能指標甚至超過了1.5 Pro!支持原生工具調用、以及實時音視頻流輸入等新功能。

速度更快,多模態(tai)、文本、代碼、視頻(pin)、空間理解和(he)推理能(neng)力全面提升(sheng)!新能(neng)力比如空間理解,視頻(pin)理解等可以(yi)通過Googele AI Studio的Starter Apps來體驗;
例如(ru)1,Gemini 2.0對空間的理解,利用Spatial Understanding,上傳(chuan)一(yi)張圖(tu)(tu)片,Gemini快速進行圖(tu)(tu)像(xiang)中的物體檢測和標注,并生成結構化的數據(JSON格式)。它的設(she)計直觀,用戶可(ke)以通過簡單的交互操作快速獲(huo)得檢測結果。這種工(gong)具可(ke)能用于(yu)機器學習(xi)訓練數據準(zhun)備(bei)、圖(tu)(tu)像(xiang)分(fen)析(xi)或計算機視覺研究等場景;
例(li)如2,Gemini 2.0地圖交(jiao)互,利用Map explorer,show一下世(shi)界上最有意思(si)的大城市;
全新輸出模態:支持文本、音(yin)頻和(he)圖(tu)像的(de)集(ji)成(cheng)響應(ying),多語言(yan)原(yuan)生音(yin)頻輸(shu)(shu)出,8種(zhong)高品質(zhi)語音(yin),多種(zhong)語言(yan)和(he)口音(yin)!原(yuan)生圖(tu)像輸(shu)(shu)出,還能進(jin)行多輪編輯迭代(dai)直到生成(cheng)滿意的(de)圖(tu)像;
原生工具使用:Gemini 2.0可(ke)以直接調用Google搜索(suo)、代碼執行等工具,還能通過函(han)數調用使(shi)用自定義的第三(san)方函(han)數!
多模態實時API:支(zhi)持實時(shi)音視頻流輸入,還能進行語音活動檢測,甚至(zhi)可以(yi)集成(cheng)多(duo)個工具(ju)完成(cheng)復(fu)雜任(ren)務!現在通過Stream Realtime就可以(yi)體(ti)驗(yan);
例如,把電腦屏幕交給(gei)Gemini 2.0接管,它可以在你與(yu)模型(xing)實(shi)時交互的(de)同時進行搜索和編碼。
谷歌正在積極探索AI“代理(li)”的應(ying)用,目(mu)標是(shi)打造能(neng)夠自主理(li)解、規劃和執行任務的智能(neng)助手。他們(men)已經推出了一系列Agent原型(目(mu)前(qian)僅(jin)供測試(shi)人員使用),展示了AI代理(li)在不(bu)同領域的巨大潛(qian)力:
Jules,你的AI編程伙伴:想象一(yi)(yi)下(xia),你(ni)(ni)(ni)的(de)(de)團隊剛完成了一(yi)(yi)輪bug排查,一(yi)(yi)堆bug亟待修復(fu)。現在,你(ni)(ni)(ni)可以把Python和(he)JavaScript的(de)(de)編碼任(ren)務交給Jules。它與你(ni)(ni)(ni)的(de)(de)GitHub工作(zuo)流無(wu)縫(feng)集成,可以異步(bu)處理bug修復(fu)和(he)其他(ta)耗時(shi)的(de)(de)任(ren)務,讓你(ni)(ni)(ni)專注于核心開(kai)發(fa)工作(zuo)。Jules會創建(jian)全(quan)面的(de)(de)、多(duo)步(bu)驟的(de)(de)計劃(hua)來(lai)解決問(wen)題,高效地(di)修改多(duo)個(ge)文件,甚(shen)至能(neng)準備pull requests,直接(jie)將修復(fu)提(ti)交到(dao)GitHub!更重(zhong)要的(de)(de)是,Jules賦予開(kai)發(fa)者(zhe)更多(duo)自主權(quan):你(ni)(ni)(ni)可以隨時(shi)查看(kan)Jules創建(jian)的(de)(de)計劃(hua),提(ti)供反饋或要求調(diao)整,并(bing)輕松審(shen)查和(he)合(he)并(bing)Jules編寫的(de)(de)代碼。
Colab數據科學代理,你的AI分析師:繁瑣的數據(ju)分(fen)析Colab數據(ju)科學代(dai)理幫你搞定!只需(xu)用(yong)自然語言描述你的分(fen)析目標,Colab就能自動生成一個(ge)完整的notebook,并在幾分(fen)鐘(zhong)內提供洞察。所有(you)分(fen)析都基于(yu)一個(ge)可(ke)運行的Colab notebook,保證結果(guo)的可(ke)靠性和可(ke)重復性。這將極大地加速你的研(yan)究和數據(ju)分(fen)析進(jin)程(cheng)。
Project Mariner,重新定義人機交互:Project Mariner旨在探索人機交(jiao)(jiao)互的(de)(de)未來,從瀏(liu)(liu)覽(lan)器開(kai)始。它是一個實(shi)驗性的(de)(de)Chrome擴展程(cheng)序(xu),可以讓(rang)AI代理在你(ni)的(de)(de)瀏(liu)(liu)覽(lan)器中執行各種任(ren)務(wu),例如查(cha)找信(xin)息、填寫表格、甚至與網站進行交(jiao)(jiao)互。
Gemini Advance模式:谷歌(ge)在高級版中推出一(yi)項名為(wei)"深(shen)(shen)度(du)研究"的(de)新代理功(gong)能,這是(shi)一(yi)個研究助手,可以(yi)深(shen)(shen)入研究復雜的(de)主題,并(bing)為(wei)你創(chuang)建帶有相關來源鏈接的(de)報告(gao),感覺這是(shi)直接寫科研論文的(de)節奏。
游戲和其他領域的AI代理:DeepMind在(zai)(zai)游(you)(you)戲(xi)AI領域積累了(le)豐富(fu)的經(jing)驗,現在(zai)(zai)他們將Gemini 2.0應用于游(you)(you)戲(xi)代理的開(kai)發。例如,一(yi)(yi)個AI伙伴陪你一(yi)(yi)起玩游(you)(you)戲(xi),還(huan)能提供專業的指導(dao),游(you)(you)戲(xi)體驗將提升到(dao)一(yi)(yi)個全新的層次!更(geng)牛(niu)的是,這(zhe)些代理還(huan)能連(lian)接到(dao)Google搜(sou)索,獲取海量的游(you)(you)戲(xi)知識,成為你真(zhen)正的游(you)(you)戲(xi)專家!目前,他們正與Supercell等(deng)(deng)游(you)(you)戲(xi)開(kai)發商(shang)合作,在(zai)(zai)“部落沖(chong)突”和“卡(ka)通(tong)農場”等(deng)(deng)游(you)(you)戲(xi)中測試這(zhe)些代理。

谷歌(ge)9日宣(xuan)布推出(chu)最新(xin)量(liang)子(zi)芯片Willow。谷歌(ge)首席(xi)執行(xing)官孫達(da)爾·皮柴稱(cheng)其為邁向打造實用量(liang)子(zi)計算機的重(zhong)要一步。
谷歌在官方博客刊文說(shuo),Willow取得了(le)(le)兩項重大(da)成就:首先(xian),使用更多量(liang)子比特進行擴展,可(ke)大(da)幅度減少(shao)錯誤(wu),解決了(le)(le)量(liang)子糾(jiu)錯領域(yu)近30年來一直試圖攻克(ke)的(de)關鍵難題。另外,在標準(zhun)基(ji)準(zhun)計算測試中,Willow展示(shi)了(le)(le)非常(chang)高的(de)性能。
量子比特利用疊加態來進行計算,對環境(jing)擾動極(ji)其敏感。通(tong)常量子比特越(yue)多(duo)(duo),發生的(de)錯誤(wu)就越(yue)多(duo)(duo),而新研究(jiu)有助解決這一(yi)難(nan)題(ti)。這一(yi)已發布在(zai)《自(zi)然》雜志上的(de)研究(jiu)顯示,在(zai)Willow芯(xin)片中使用的(de)量子比特越(yue)多(duo)(duo),系(xi)統的(de)錯誤(wu)率(lv)越(yue)低(di)(di),“取得了‘低(di)(di)于閾值’的(de)歷(li)史性成就,即在(zai)增加量子比特數(shu)量的(de)同時(shi)降(jiang)低(di)(di)錯誤(wu)率(lv)”。
谷歌量(liang)子人工智能實驗室創始人和領(ling)導者哈(ha)特(te)(te)穆(mu)特(te)(te)·內文說(shuo),作為第(di)一個低于(yu)閾值的(de)(de)系統,這是迄今為止最可(ke)信的(de)(de)可(ke)擴展邏輯量(liang)子比特(te)(te)原型。Willow芯(xin)片的(de)(de)推出讓量(liang)子計算向(xiang)商(shang)業應用方向(xiang)邁(mai)進了一大步(bu)。下一步(bu)挑(tiao)戰(zhan)是展示(shi)量(liang)子芯(xin)片超越經(jing)典計算機,又能解決現實問(wen)題的(de)(de)能力。
內文還表示,谷歌首創的(de)隨機(ji)(ji)電(dian)路采樣(yang)(RCS)基準(zhun),已被廣泛用(yong)于量(liang)(liang)子(zi)計算(suan)領域,是當(dang)(dang)今量(liang)(liang)子(zi)計算(suan)機(ji)(ji)可(ke)完(wan)成(cheng)的(de)難度(du)最高的(de)經典(dian)基準(zhun)。Willow基于該(gai)基準(zhun)取得了驚人(ren)表現,在不到五(wu)分鐘的(de)時間(jian)完(wan)成(cheng)了當(dang)(dang)今領先的(de)超級計算(suan)機(ji)(ji)需要10的(de)25次方年(nian)才能完(wan)成(cheng)的(de)計算(suan),“這一令(ling)人(ren)難以置信的(de)數(shu)字超出(chu)了物理(li)學中已知的(de)時間(jian)尺度(du),遠遠超過(guo)了宇宙年(nian)齡”。
內(nei)文說,人工(gong)(gong)智能(neng)(neng)和量子(zi)(zi)計算將被(bei)證明(ming)是當代最具變革性的兩(liang)項技術(shu),先進(jin)的人工(gong)(gong)智能(neng)(neng)將從量子(zi)(zi)計算中受益匪(fei)淺。這也是他(ta)將實驗室命名(ming)為量子(zi)(zi)人工(gong)(gong)智能(neng)(neng)的原(yuan)因。
每日經(jing)濟新聞綜合Google官(guan)網(wang)、公開消息
封(feng)面圖(tu)片來源:視頻截圖(tu)
如需轉載請與《每日經濟新聞》報社聯系。
未經(jing)《每(mei)日經(jing)濟新聞》報(bao)社授權,嚴禁轉載或鏡像(xiang),違者(zhe)必(bi)究。
讀(du)者熱線(xian):4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取(qu)稿酬。如您(nin)不(bu)希望作(zuo)品(pin)出(chu)現在本站,可聯系我(wo)們要求(qiu)撤下(xia)您(nin)的作(zuo)品(pin)。
歡迎關注每(mei)日經濟新聞(wen)APP