暖暖视频在线观看日本/国产成人精品a视频一区/精人妻无码一区二区三区/成在线人免费视频/17c一起草

每日經濟新聞
輪播

每經網首頁 > 輪播 > 正文

專訪騰訊云副總裁答治茜:大模型時代下,知識庫是企業的基礎設施

2025-10-27 22:12:46

在實體經濟與數字經濟日益融合的背景下,企業積極擁抱大模型,但金融行業因其特殊性,通用大模型難以滿足需求。騰訊云副總裁答治茜認為,“大模型+企業知識庫”是AI落地最佳路徑,知識庫是企業的基礎設施,金融行業對“大模型+知識庫”安全性、準確性要求高,更關注員工知識沉淀。他同時還分享了避免大模型“杜撰”的方法。

 每經記者|潘婷    每經編輯|陳旭    

在實體經濟和數字經濟日益深度融合的大背景下,越來越多企業正積極擁抱大模型。不過,對于安全性、準確性要求極高的金融行業來說,通用大模型往往無法滿足其需求。

“在實際落地過程中,‘大模型+企業知識庫’成為AI落地的最佳路徑。”近日,騰訊云副總裁答治茜在接受《每日經濟新聞》(以下簡稱NBD)記者專訪時坦言,金融機構普遍面臨著知識孤島化、非結構化數據海量、合規成本高企等知識管理的困境。

如何破解金融行業知識管理困境?金融行業對“大模型+知識庫”的關注點呈現怎樣的特點?如何看待大模型落地過程中出現的“杜撰”“錯配”等現象?圍繞這一系列話題,答治茜為記者進行了詳細的解答。

大模型是“大腦”,知識庫是“課本”

當前,大模型技術正惠及千行百業,金融行業也在探索符合金融規律的AI(人工智能)知識庫建設路徑。AI知識庫作為連接數據、算法與場景的核心樞紐,是金融機構實現“從技術到價值”轉化的關鍵抓手。

NBD:大模型時代,企業的“知識庫”扮演了什么角色?金融領域專屬模型和通用大模型有什么差別?

答治茜 圖片來源:受訪者

答治茜:在大模型時代下,我們認為知識庫是企業的一種基礎設施。大模型是“大腦”,知識庫是“課本”,大腦智力再高,如果沒有學習過相關的知識,也無法很好地解決問題。

“通用大模型+專業領域知識庫”的研發類似“大腦+課本”模式。首先,需要投入巨大資源訓練一個“萬事通”基座模型,或者直接采用市面上已有的效果最優的模型,使其具備強大的語言理解、邏輯推理和代碼能力。然后,通過RAG(Retrieval-augmented Generation檢索增強生成)技術,為這個“通才”配備一個龐大的、實時更新的金融知識庫,如行業研報、公司公告、實時新聞、風控規則等。這種模式的優勢是靈活性高、迭代快、成本相對可控。

而“金融領域專屬模型”的研發類似“科班出身”模式,從模型訓練的第一天起,就使用海量且高質量的金融領域私有數據進行從零開始的預訓練,讓模型從“基因”里就深刻理解金融術語、市場邏輯和專業范式。

允許員工個人創建知識庫空間

對銀行、證券、保險等企業的從業者而言,企業知識庫早已不是簡單的文檔管理系統,而是承載著風險管控、合規審查、客戶服務等核心職能的“智能大腦”。

NBD:金融行業對“大模型+知識庫”的關注點呈現怎樣的特點?

答治茜:首先,金融行業對于知識庫安全與合規的要求更高。

由于金融行業監管的特殊性,數據安全、監管要求、信創適配等成為數字化建設底線。所以,為了更好滿足金融企業的需求,我們AI知識庫建設需要有更專業化的能力,比如精細化的多級權限管理體系、防泄露的頁面水印、嚴謹的審計能力和內容風控體系等。

其次,金融行業對知識問答準確性和嚴謹性的要求極高。

金融是非常嚴謹的行業,員工每天都在跟數字和知識打交道,所以知識內容非常豐富,也很復雜,而且大家對于知識庫的期待很高,如希望多表格數據的計算、財報里多模態數據的解讀、銀行理財產品推薦等等,這對我們提出很大的挑戰。為此,我們專門在AI出圖、表格計算、知識溯源等方面下了很多功夫,并取得了階段性突破。

再次,金融行業更關注員工個人知識的沉淀。在與銀行、資管企業溝通過程中,我們發現很多金融企業非常希望員工個人的經驗知識能沉淀下來,把個人經驗變成企業知識。另外,我們發現很多金融企業員工日常需要的知識內容也是有差異的,所以“個人知識庫”的概念今年被廣泛關注,我們在知識庫中設計了允許員工個人創建知識庫空間的功能,同時打通微信、騰訊文檔、企業微信等。

NBD:數據安全是企業發展過程中非常重要的環節,對于金融企業來說尤其如此,您如何看待數據安全問題?

答治茜:金融行業對于監管、數據運營等有非常高的數據安全和隱私保護的要求。我們要從兩個方面思考:

一是技術和產品層面,從應用到數據、算力等所有的基礎設施,要實現私有化部署和全鏈路的安全。

另一個層面是運營層面,綜合考慮管理和技術。比如說金融機構內部某團隊有兩三百人時,內部如何協同、如何按層級劃分權限,哪些信息能讓哪些人看到,這就是管理要求,要滿足多級的授權管理。

如何避免幻覺:不亂說、能溯源、有效管理知識

在使用AI助手咨詢某個問題時,經常得到錯誤的回復,這種現象在AI圈被稱為“幻覺”,“幻覺”問題困擾著所有使用大語言模型的人。

NBD:個人使用大模型問答的時候會出現一些杜撰錯誤。如何看待大模型落地過程中出現的“杜撰”“錯配”等問題?

答治茜:ChatGPT出來后,我們就在思考大模型時代下行業會有什么樣的變化。2024年開始,樂享就轉型聚焦做AI知識庫,目前在產品功能、問答準確性上應該是比較領先的。

當前大模型“杜撰”的情況還比較普遍,我認為破解的關鍵在于三方面:答案模糊的時候拒答不亂說、輸出能有效溯源、企業內部知識實現有效治理(比如有效性和及時更新等)。考慮到樂享定位為企業級知識庫,我們做了非常多的工作去提高準確性。主要是以下幾方面:

第一,對文檔、知識進行理解。我們自研OCR(Optical Character Recognition,光學字符識別)大模型,對復雜的圖文混排文檔解析準確率提升30%以上。

第二,理解后按照一定的規則對文檔、知識進行切片存儲。我們自研業界首個基于語義切分的模型,保障切分片段語義的完整性。

第三,當用戶通過AI助手來問答時,我們會結合上下文對用戶的問題進行理解后并改寫,從而提升檢索精度。

第四,基于改寫后的用戶問題,使用向量檢索和關鍵詞檢索的混合檢索模式,找到最相關的內容。

第五,上一步可能檢索到大量內容,但并非所有內容都與問題緊密相關,因此需要對這些內容進行重新排序與過濾。

第六,基于重排后的內容調用大模型生成最終的答案。

經過以上程序,目前我們的準確率超過92%,我們會持續投入精力去提升準確率。

封面圖片來源:受訪者

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

1

0