每日經濟新聞 2025-04-11 12:30:58
4月10日下午,商湯在上海舉辦“2025技術交流日”活動,推出“日日新SenseNova V6”大模型體系。商湯董事長兼CEO徐立認為,大模型發展這么多年,其實已經用完互聯網上大部分文本數據。也有觀點預測,到2028年互聯網上所有文本數據將被消耗完。不過,在徐立看來,這并不意味著整個知識(體系)都被消耗完了。
每經記者|朱成祥 每經編輯|陳俊杰
4月10日下午,商湯在上海舉辦“2025技術交流日”活動,推出“日日新SenseNova V6”(以下簡稱“日日新V6”)大模型體系。
商湯董事長兼CEO徐立認為,大模型發展這么多年,其實已經用完互聯網上大部分文本數據。也有觀點預測,到2028年互聯網上所有文本數據將被消耗完。
不過,在徐立看來,這并不意味著整個知識(體系)都被消耗完了。徐立認為,很多知識都蘊藏在圖像、視頻或者3D模態中。但到目前為止,還沒有完全把這些知識真正用來提升原來的文本,甚至是智力的能力,因為模態的融合沒有做到那么好。
徐立認為,從人類學習的路徑來講,即使是知識的含量一樣,多模態的學習方式可能效率會更高。從小到大學習數學、幾何、物理、化學實驗,甚至學習交通規則、玩游戲的說明書等都是多模態的,從數據量來講,多模態是補充人類智能的核心要素,而從學習方法上也是更有效的。
關于商湯“日日新V6”,徐立表示,一些核心的指標,在純文本和多模態的單任務和復雜任務的推理之上,商湯都居于行業前列。
徐立稱,最早大家在做大模型的時候,領先的有OpenAI。但到今年,中國在很多情況下,能夠同步發布出對標甚至超越美國同期發布的模型,這也是行業認知逐步刷新的一個必然結果。
值得注意的是,此次技術開放日,商湯也推出用于人形機器人領域的世界模型,并與傅利葉機器人達成合作。
對于機器人自主決策,傅利葉創始人顧捷表示,機器人現在類似于會走路的大模型。當機器人能夠預測下一步動作,它就能產生大模型。但是,目前還不確定什么時候能夠真正完成VLA(視覺語言動作模型),即語言、視覺和動作的打通。目前的卡點在于大模型的思考能力是慢性的,而機器人是快速走動的。快系統與慢系統的連接,是未來研究的方向。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP
