夫妻性生活在线视频,高潮插的我好爽再干噢在线欢看,我和邻居的阿?

整體準確率超GPT-4o兩成，百川發(fā)布金融大模型

整體準確率超GPT-4o兩成,，百川發(fā)布金融大模型

來源：北京日報客戶端

記者：孫奇茹

2024-12-23 11:34

12月23日,，總部位于北京的百川智能發(fā)布全鏈路領(lǐng)域增強大模型Baichuan4-Finance。通過行業(yè)首創(chuàng)的領(lǐng)域自約束訓(xùn)練方案,，其實現(xiàn)了金融能力和通用能力同步提升的效果,，能夠大幅度提高大模型在金融場景的可用性。在中國人民大學(xué)財政金融學(xué)院新近發(fā)布的評測體系FLAME以及國內(nèi)主流開源金融評測基準FinancelQ上,，其金融專業(yè)能力和場景應(yīng)用能力大幅領(lǐng)先GPT-4o,，登上榜首,。

FLAME（Financial Large-Language Model Assessment and Metrics Evaluation）是中國人民大學(xué)財政金融學(xué)院12月17日發(fā)布的金融評測體系。該評測由兩個方向的評測基準組成,，其中FLAME-Cer主要面向模型的專業(yè)金融能力評測,，覆蓋了CPA、CFA,、FRM等14類權(quán)威金融資格認證,；FLAME-Sce則側(cè)重模型的場景應(yīng)用能力，包含10個一級核心金融業(yè)務(wù)場景,，21個二級細分金融業(yè)務(wù)場景,，近百個三級金融應(yīng)用任務(wù)。

FLAME-Cer評測結(jié)果顯示,，Baichuan4-Finance在銀行,、保險、基金,、證券等多個資格認證領(lǐng)域的準確率均突破了95%,，整體準確率93.62%，大幅領(lǐng)先GPT-4o和XuanYuan3-70B-Chat,，超出GPT-4o近20%,。據(jù)悉，GPT-4o是金融領(lǐng)域公認的綜合實力最強的通用模型之一,，而XuanYuan3-70B-Chat則是國內(nèi)首個開源中文金融大模型,。

如何讓模型在提升專業(yè)能力的同時不損失通用能力，是當(dāng)下大模型落地具體場景最大的阻礙,。為解決這一問題,，百川智能研發(fā)團隊打造了一套覆蓋了高質(zhì)量數(shù)據(jù)集構(gòu)建、模型預(yù)訓(xùn)練,、微調(diào),、強化學(xué)習(xí)等從模型研發(fā)到場景應(yīng)用全流程的解決方案。

具體而言,，Baichuan4-Finance的金融數(shù)據(jù)集既包含金融專業(yè)教材與學(xué)術(shù)著作,、頂級金融期刊論文、監(jiān)管機構(gòu)政策文件,、金融法律法規(guī)等核心專業(yè)金融知識數(shù)據(jù),，也覆蓋了金融專業(yè)問答集、企業(yè)財報與年度報告,、金融類研究分析報告等實踐應(yīng)用類數(shù)據(jù),，為提升模型金融能力提供底層支撐。研發(fā)人員介紹，在此基礎(chǔ)上,，Baichuan4-Finance還在領(lǐng)域自約束訓(xùn)練過程中引入了更高精的通用數(shù)據(jù),，與高質(zhì)量金融數(shù)據(jù)一起進行混合訓(xùn)練，最終實現(xiàn)了模型通用能力不下降,，金融能力穩(wěn)定增長的效果,。

以“大模型六小虎”（智譜、零一萬物,、MiniMax,、百川智能、月之暗面,、階躍星辰）為代表的大模型創(chuàng)業(yè)企業(yè)的商業(yè)化落地情況備受行業(yè)關(guān)注,。百川智能相關(guān)負責(zé)人透露，其大模型技術(shù)和產(chǎn)品目前已經(jīng)在北電數(shù)智,、完美世界游戲,、愛奇藝、360集團,、生學(xué)教育,、愛學(xué)堂等上千家企業(yè)機構(gòu)客戶落地應(yīng)用。

來源：北京日報客戶端

記者：孫奇茹

如遇作品內(nèi)容,、版權(quán)等問題,，請在相關(guān)文章刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系。版權(quán)侵權(quán)聯(lián)系電話：010-85202353