暖暖视频在线观看日本/国产成人精品a视频一区/精人妻无码一区二区三区/成在线人免费视频/17c一起草

每日經濟新聞
要聞

每經網首頁 > 要聞 > 正文

小米開源首個推理大模型 曾說不做OpenAI類大模型,現開出百萬元年薪給團隊“招兵買馬”

每日經濟(ji)新聞 2025-05-02 00:04:53

4月30日,小米開(kai)源其(qi)首個(ge)推(tui)(tui)理(li)大模(mo)型Xiaomi MiMo,同時公開(kai)了小米大模(mo)型Core團(tuan)隊。該模(mo)型參數規(gui)模(mo)7B,在數學推(tui)(tui)理(li)和(he)代碼競賽測(ce)評(ping)中超越了OpenAI的(de)閉(bi)源推(tui)(tui)理(li)模(mo)型o1-mini和(he)阿里Qwen開(kai)源推(tui)(tui)理(li)模(mo)型QwQ-32B-Preview。此外,小米已啟動大模(mo)型人才(cai)招聘,崗(gang)位包(bao)括“大模(mo)型算法專家(jia)”等,招聘詳情顯示,小米大模(mo)型的(de)應用(yong)場景(jing)大多(duo)與自身(shen)業務(wu)或(huo)產(chan)品相關。

每經記者|楊卉    每經編輯|魏官紅    

曾說不做(zuo)OpenAI類大模型的小米變了。

4月30日,小米開(kai)源其首個(ge)推理大模型(xing)(xing)(xing)Xiaomi MiMo,同時公開(kai)了一個(ge)此前未曾公開(kai)露面的團隊(dui):小米大模型(xing)(xing)(xing)Core團隊(dui)。根據小米自己的說法,該模型(xing)(xing)(xing)只是團隊(dui)的初(chu)步嘗試。至于為何還(huan)是趕(gan)了“晚班(ban)車”,小米方面稱,2025年雖(sui)看似是大模型(xing)(xing)(xing)逐(zhu)夢的后(hou)半程,不(bu)過(guo)還(huan)是堅(jian)信(xin)AGI(通(tong)用(yong)人工(gong)智(zhi)能)征途仍漫長。

參(can)數(shu)方面,根據介(jie)紹,小(xiao)米經強化(hua)學(xue)習訓練形成的MiMo-7B-RL模型,在數(shu)學(xue)推(tui)理(AIME 24-25)和代碼競賽(LiveCodeBench v5)公開測評集上(shang),用7B參(can)數(shu)規模,得(de)分超過了OpenAI的閉(bi)源推(tui)理模型o1-mini和阿(a)里Qwen開源推(tui)理模型QwQ-32B-Preview。

在這篇推介自家大模型的文(wen)章末尾,小米還(huan)默默公開(kai)了一個簡歷投遞(di)郵箱,為剛成立不(bu)久的團隊“招兵買馬”。

《每(mei)日經濟新(xin)聞(wen)》記者注意到,在部分招(zhao)聘(pin)(pin)軟件上(shang),小米(mi)已經上(shang)線了大量與大模(mo)(mo)型(xing)(xing)相關的招(zhao)聘(pin)(pin)信息,如(ru)“大模(mo)(mo)型(xing)(xing)算法專(zhuan)家”“大模(mo)(mo)型(xing)(xing)推理工(gong)程(cheng)師”“大模(mo)(mo)型(xing)(xing)數(shu)據策略(lve)工(gong)程(cheng)師”等(deng),其中公(gong)布的年薪最高可達128萬元。此(ci)外,從招(zhao)聘(pin)(pin)詳情里(li)也能(neng)(neng)看到小米(mi)給(gei)大模(mo)(mo)型(xing)(xing)落地找(zhao)到的一(yi)些場景,如(ru)智(zhi)(zhi)能(neng)(neng)門鎖(suo)、智(zhi)(zhi)能(neng)(neng)音箱(xiang)、智(zhi)(zhi)能(neng)(neng)招(zhao)聘(pin)(pin)、AI(人工(gong)智(zhi)(zhi)能(neng)(neng))面試、AI會議助理、AI辦公(gong)助手(shou)、智(zhi)(zhi)能(neng)(neng)客(ke)服、智(zhi)(zhi)能(neng)(neng)審核等(deng),大多(duo)與其自身現有業務或產品相關。

開源首個推理大模型 模型參數只有7B

4月(yue)30日,一個(ge)頂著黑(hei)底(di)白(bai)字頭像(xiang)的(de)微信公眾(zhong)號僅憑(ping)首條推送,就單(dan)槍(qiang)匹馬掀起了大模型產業(ye)的(de)又一輪熱議。仔細來看,這個(ge)頭像(xiang)傳遞的(de)信息簡單(dan)且直(zhi)接,黑(hei)色背景(jing)內的(de)一行白(bai)字說明了來處:Xiaomi MiMo;賬戶歸屬為(wei)北京小米移動軟(ruan)件(jian)有(you)限公司,于4月(yue)24日將新注(zhu)冊公眾(zhong)號改名為(wei)“Xiaomi MiMo”。

改名后不到(dao)一周,小米放出(chu)個“大(da)招”,直(zhi)接官宣開源首個推理大(da)模型。

根據(ju)推(tui)(tui)文內容,從參(can)數(shu)來看,隨著DeepSeek-R1引發(fa)業界(jie)強化(hua)學(xue)習(xi)(RL)共創潮(chao),DeepSeek-R1-Distill-7B和(he)Qwen2.5-32B已成為廣泛使用(yong)的強化(hua)學(xue)習(xi)起步模型(xing)。根據(ju)小米方面(mian)的說(shuo)法,Xiaomi MiMo是公(gong)司首個為推(tui)(tui)理而生的大模型(xing),可(ke)聯(lian)動預訓練到后訓練。在數(shu)學(xue)推(tui)(tui)理(AIME 24-25)和(he)代碼(ma)競賽(LiveCodeBench v5)公(gong)開測評(ping)集上,MiMo用(yong)7B的參(can)數(shu)規模,超(chao)越了(le)OpenAI的閉源推(tui)(tui)理模型(xing)o1-mini和(he)阿里Qwen更大規模的開源推(tui)(tui)理模型(xing)QwQ-32B-Preview。

圖片來源(yuan):微(wei)信(xin)公眾號“Xiaomi MiMo”推文截圖

值得關注的是(shi),小米這(zhe)次開源(yuan)的模型參數規模只(zhi)有7B,這(zhe)就意味著可以(yi)在端側設(she)備上進行(xing)本地運行(xing),主打一個經濟(ji)高(gao)效。

至于推文中(zhong)提到的(de)預(yu)(yu)訓(xun)(xun)練(lian)(lian)和(he)后訓(xun)(xun)練(lian)(lian),據(ju)悉,MiMo推理(li)能力的(de)提升是由預(yu)(yu)訓(xun)(xun)練(lian)(lian)和(he)后訓(xun)(xun)練(lian)(lian)階段中(zhong)數據(ju)和(he)算法等多(duo)(duo)層面的(de)創新聯合驅動。其中(zhong),預(yu)(yu)訓(xun)(xun)練(lian)(lian)的(de)核(he)心(xin)是讓模型(xing)見過更多(duo)(duo)推理(li)模式,著重(zhong)挖(wa)掘(jue)富推理(li)語料,并(bing)合成約(yue)200B tokens推理(li)數據(ju)。訓(xun)(xun)練(lian)(lian)方面共進行了三階段訓(xun)(xun)練(lian)(lian),逐步提升訓(xun)(xun)練(lian)(lian)難度,總訓(xun)(xun)練(lian)(lian)25T tokens。

而后(hou)訓練的核心則(ze)是高效穩定(ding)的強化(hua)學習算法(fa)和框(kuang)架,其算法(fa)提出(chu)Test Difficulty Driven Reward來緩解困(kun)難算法(fa)問題(ti)中的獎勵(li)稀疏(shu)問題(ti),并引(yin)入Easy Data Re-Sampling策略,以穩定(ding)RL訓練。框(kuang)架方面,設(she)計了(le)Seamless Rollout系(xi)統,使得RL訓練加速(su)(su)2.29倍(bei),驗證可加速(su)(su)1.96倍(bei)。

開出百萬元年薪招聘大模型算法專家 應用場景大多與自身業務相關

小(xiao)米(mi)方面(mian)稱,MiMo是(shi)新成立不久的小(xiao)米(mi)大(da)模(mo)型(xing)Core團隊(dui)(dui)的初(chu)步(bu)嘗試。其實(shi),嚴格來說,小(xiao)米(mi)的大(da)模(mo)型(xing)團隊(dui)(dui)Core雖然是(shi)第一次帶(dai)著作品亮相,但(dan)小(xiao)米(mi)有大(da)模(mo)型(xing)團隊(dui)(dui)這件(jian)事(shi)并不是(shi)“全網首(shou)秀”,小(xiao)米(mi)集團早在(zai)2023年(nian)4月就組(zu)建了AI實(shi)驗室大(da)模(mo)型(xing)團隊(dui)(dui)。

值(zhi)得(de)深究的是,大模型火熱至(zhi)今,已經(jing)從“卷(juan)”參數、“卷(juan)”模型進入了(le)“卷(juan)”落地應用(yong)的“下半程”,小米此(ci)時趕這個“晚班車(che)”意欲(yu)何為(wei)?

其實,小米(mi)(mi)曾公(gong)開(kai)表示不(bu)會做(zuo)大(da)模型。2023年(nian)5月24日,小米(mi)(mi)集(ji)團披露了(le)2023年(nian)第(di)一季度業績,小米(mi)(mi)集(ji)團總裁盧(lu)偉(wei)冰還在同日的(de)電話(hua)財(cai)報會上談到了(le)彼時(shi)大(da)廠開(kai)啟(qi)的(de)“大(da)模型競(jing)賽”。那(nei)時(shi),盧(lu)偉(wei)冰直言,小米(mi)(mi)集(ji)團不(bu)會做(zuo)OpenAI類的(de)大(da)模型,但會積極擁抱AI,將其與自身業務(wu)深度結(jie)合,提高智(zhi)能化水平。

時隔兩年,小(xiao)米的(de)(de)(de)態度(du)為何變了(le)?4月30日下(xia)午,《每日經(jing)濟新聞》記者(zhe)向(xiang)小(xiao)米集團方(fang)面(mian)咨詢大(da)模(mo)型團隊的(de)(de)(de)更多信(xin)息(xi),截(jie)至發(fa)稿未獲有(you)效回復(fu)。不過(guo),根據微信(xin)公眾號Xiaomi MiMo的(de)(de)(de)推文,小(xiao)米顯然(ran)也意識(shi)到了(le)現(xian)在入(ru)場(chang)并不算早(zao)。至于入(ru)場(chang)原因,小(xiao)米方(fang)面(mian)的(de)(de)(de)說法是:“2025年雖看似是大(da)模(mo)型逐(zhu)夢的(de)(de)(de)后半程(cheng),但我們堅信(xin)AGI的(de)(de)(de)征途仍漫長。”

值得(de)關(guan)注(zhu)的(de)是(shi)(shi),不管原因為何,小米(mi)集團在(zai)做大模(mo)型這件事上確實“上心”了。《每(mei)日經濟新(xin)聞》記者注(zhu)意到(dao),在(zai)某招聘平臺上,北京小米(mi)移動軟件有限公司,也就是(shi)(shi)Xiaomi MiMo公眾(zhong)號的(de)賬號歸屬方,已經開始了“招兵買馬”,放(fang)出大量與大模(mo)型相關(guan)的(de)崗位招聘信息。

具體來看,在招(zhao)(zhao)崗(gang)位(wei)不少,有(you)“大(da)(da)(da)(da)模(mo)型(xing)算(suan)法(fa)(fa)”“大(da)(da)(da)(da)模(mo)型(xing)推理工程(cheng)(cheng)師(shi)”“大(da)(da)(da)(da)模(mo)型(xing)數據策略(lve)工程(cheng)(cheng)師(shi)”“大(da)(da)(da)(da)模(mo)型(xing)高性能優化工程(cheng)(cheng)師(shi)”“多模(mo)態大(da)(da)(da)(da)模(mo)型(xing)算(suan)法(fa)(fa)工程(cheng)(cheng)師(shi)”“端(duan)(duan)到(dao)端(duan)(duan)大(da)(da)(da)(da)模(mo)型(xing)算(suan)法(fa)(fa)工程(cheng)(cheng)師(shi)”“具身大(da)(da)(da)(da)模(mo)型(xing)算(suan)法(fa)(fa)工程(cheng)(cheng)師(shi)”等,部(bu)分招(zhao)(zhao)聘信息(xi)中還寫明了“急招(zhao)(zhao)”。

圖片來源:招(zhao)聘軟件(jian)截(jie)圖

另外,從招聘詳情中(zhong)(zhong)或可以窺見小米做大(da)(da)(da)模(mo)型(xing)的方(fang)向(xiang),如直接表明“文生圖(tu),圖(tu)生圖(tu)大(da)(da)(da)模(mo)型(xing)算(suan)法”,再如“多模(mo)態大(da)(da)(da)模(mo)型(xing)算(suan)法工程師”一(yi)職(zhi)(zhi)(zhi),崗位詳情中(zhong)(zhong)提到,需(xu)要(yao)求職(zhi)(zhi)(zhi)者進行(xing)大(da)(da)(da)模(mo)型(xing)算(suan)法部署(shu)和(he)小型(xing)化研究(jiu),還需(xu)負(fu)責大(da)(da)(da)模(mo)型(xing)算(suan)法的落地(di)應用,包括智(zhi)能門(men)鎖、智(zhi)能音箱(xiang)等場景。“大(da)(da)(da)模(mo)型(xing)算(suan)法”一(yi)職(zhi)(zhi)(zhi)的招聘詳情中(zhong)(zhong)還提到,求職(zhi)(zhi)(zhi)者需(xu)圍繞智(zhi)能招聘、AI面(mian)試(shi)、AI會議助(zhu)(zhu)理、AI辦(ban)公助(zhu)(zhu)手(shou)、智(zhi)能客服、智(zhi)能審核等應用場景,利用大(da)(da)(da)語言模(mo)型(xing)和(he)多模(mo)態大(da)(da)(da)模(mo)型(xing)制(zhi)定解決方(fang)案并進行(xing)迭代優化。

圖片(pian)來源:招聘軟件截圖

從上述信息不難看出(chu)(chu),小(xiao)米做(zuo)或者用(yong)大(da)模(mo)型(xing)有兩個傾向(xiang),一個是小(xiao)型(xing),便于落地(di)端側;還有就是應用(yong)場景大(da)多與自身業務及(ji)產品線相關。至于薪(xin)資方面,小(xiao)米招聘大(da)模(mo)型(xing)相關崗位(wei)給出(chu)(chu)的(de)薪(xin)資各不相同(tong),其中部分(fen)崗位(wei)公(gong)開(kai)的(de)最高年(nian)薪(xin)可達128萬元。

封(feng)面圖(tu)片來(lai)源(yuan):每日經濟新聞 資(zi)料圖(tu)

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社(she)授權,嚴禁(jin)轉載或鏡像,違者必(bi)究(jiu)。

讀(du)者熱線:4008890008

特別提(ti)醒:如果我們使用了您的圖片,請作者與本站聯系索(suo)取(qu)稿酬。如您不希望作品出現在本(ben)站(zhan),可(ke)聯(lian)系我們(men)要求撤(che)下您的作品。

模型 大模(mo)型

歡(huan)迎(ying)關注每日經濟新(xin)聞APP

每經經濟新聞官方APP

0

0