暖暖视频在线观看日本/国产成人精品a视频一区/精人妻无码一区二区三区/成在线人免费视频/17c一起草

每日經濟新聞
首發快訊

每經網首頁 > 首發快訊 > 正文

華為將發布AI推理創新技術UCM 實現高吞吐、低時延體驗

2025-08-12 13:29:24

每經AI快訊,據央視新聞,8月12日,在2025金融AI推理應用落地與發展論壇上,華為將發布AI推理創新技術UCM(推理記憶數據管理器)。作為一款以KV Cache為中心的推理加速套件,其融合了多類型緩存加速算法工具,分級管理推理過程中產生的KV Cache記憶數據,擴大了推理上下文窗口,以實現高吞吐、低時延的推理體驗,降低每Token的推理成本。

據介紹,推理體驗直接關系到用戶與AI交互時的感受,包括回答問題的時延、答案的準確度以及復雜上下文的推理能力等方面。當前,隨著AI產業已從“追求模型能力的極限”轉向“追求推理體驗的最優化”,推理體驗直接關聯用戶滿意度、商業可行性等,成為衡量模型價值的黃金標尺。

責編 王瀚黎

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0