3月10日,,上海機器人初創(chuàng)公司智元機器人正式發(fā)布智元啟元大模型GenieOperator-1(GO-1),,這是中國首個通用具身基座模型。智元機器人表示,,這款模型具有泛化能力,能夠在極少數(shù)據(jù)甚至零樣本下泛化到新場景、新任務,,降低了具身模型的使用門檻,降低了后訓練成本,。

 

據(jù)介紹,,該模型開創(chuàng)性地提出了Vision-Language-Latent-Action(ViLLA)架構,實現(xiàn)了可以利用人類視頻學習,,完成小樣本快速泛化,。ViLLA架構是由VLM(多模態(tài)大模型) + MoE(混合專家)組成,其中VLM借助海量互聯(lián)網(wǎng)圖文數(shù)據(jù)獲得通用場景感知和語言理解能力,,MoE中的Latent Planner(隱式規(guī)劃器)借助大量跨本體和人類操作數(shù)據(jù)獲得通用的動作理解能力,,MoE中的Action Expert(動作專家)借助百萬真機數(shù)據(jù)獲得精細的動作執(zhí)行能力。在推理時,,VLM(多模態(tài)大模型),、Latent Planner(隱式規(guī)劃器)和Action Expert(動作專家)三者協(xié)同工作。目前智元啟元大模型已成功部署到智元多款機器人本體,。

來源:@澎湃新聞

流程編輯:U022

如遇作品內容,、版權等問題,請在相關文章刊發(fā)之日起30日內與本網(wǎng)聯(lián)系,。版權侵權聯(lián)系電話:010-85202353