12月23日,,總部位于北京的百川智能發(fā)布全鏈路領(lǐng)域增強大模型Baichuan4-Finance。通過行業(yè)首創(chuàng)的領(lǐng)域自約束訓(xùn)練方案,,其實現(xiàn)了金融能力和通用能力同步提升的效果,,能夠大幅度提高大模型在金融場景的可用性。在中國人民大學(xué)財政金融學(xué)院新近發(fā)布的評測體系FLAME以及國內(nèi)主流開源金融評測基準FinancelQ上,,其金融專業(yè)能力和場景應(yīng)用能力大幅領(lǐng)先GPT-4o,,登上榜首,。

FLAME(Financial Large-Language Model Assessment and Metrics Evaluation)是中國人民大學(xué)財政金融學(xué)院12月17日發(fā)布的金融評測體系。該評測由兩個方向的評測基準組成,,其中FLAME-Cer主要面向模型的專業(yè)金融能力評測,,覆蓋了CPA、CFA,、FRM等14類權(quán)威金融資格認證,;FLAME-Sce則側(cè)重模型的場景應(yīng)用能力,包含10個一級核心金融業(yè)務(wù)場景,,21個二級細分金融業(yè)務(wù)場景,,近百個三級金融應(yīng)用任務(wù)。

FLAME-Cer評測結(jié)果顯示,,Baichuan4-Finance在銀行,、保險、基金,、證券等多個資格認證領(lǐng)域的準確率均突破了95%,,整體準確率93.62%,大幅領(lǐng)先GPT-4o和XuanYuan3-70B-Chat,,超出GPT-4o近20%,。據(jù)悉,GPT-4o是金融領(lǐng)域公認的綜合實力最強的通用模型之一,,而XuanYuan3-70B-Chat則是國內(nèi)首個開源中文金融大模型,。

如何讓模型在提升專業(yè)能力的同時不損失通用能力,是當(dāng)下大模型落地具體場景最大的阻礙,。為解決這一問題,,百川智能研發(fā)團隊打造了一套覆蓋了高質(zhì)量數(shù)據(jù)集構(gòu)建、模型預(yù)訓(xùn)練,、微調(diào),、強化學(xué)習(xí)等從模型研發(fā)到場景應(yīng)用全流程的解決方案。

具體而言,,Baichuan4-Finance的金融數(shù)據(jù)集既包含金融專業(yè)教材與學(xué)術(shù)著作,、頂級金融期刊論文、監(jiān)管機構(gòu)政策文件,、金融法律法規(guī)等核心專業(yè)金融知識數(shù)據(jù),,也覆蓋了金融專業(yè)問答集、企業(yè)財報與年度報告,、金融類研究分析報告等實踐應(yīng)用類數(shù)據(jù),,為提升模型金融能力提供底層支撐。研發(fā)人員介紹,在此基礎(chǔ)上,,Baichuan4-Finance還在領(lǐng)域自約束訓(xùn)練過程中引入了更高精的通用數(shù)據(jù),,與高質(zhì)量金融數(shù)據(jù)一起進行混合訓(xùn)練,最終實現(xiàn)了模型通用能力不下降,,金融能力穩(wěn)定增長的效果,。

以“大模型六小虎”(智譜、零一萬物,、MiniMax,、百川智能、月之暗面,、階躍星辰)為代表的大模型創(chuàng)業(yè)企業(yè)的商業(yè)化落地情況備受行業(yè)關(guān)注,。百川智能相關(guān)負責(zé)人透露,其大模型技術(shù)和產(chǎn)品目前已經(jīng)在北電數(shù)智,、完美世界游戲,、愛奇藝、360集團,、生學(xué)教育,、愛學(xué)堂等上千家企業(yè)機構(gòu)客戶落地應(yīng)用。

來源:北京日報客戶端

記者:孫奇茹

如遇作品內(nèi)容,、版權(quán)等問題,,請在相關(guān)文章刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系。版權(quán)侵權(quán)聯(lián)系電話:010-85202353