掃一掃
下載數(shù)字化報APP
科技日報訊(作者李禾)近日,由盛大AI團隊研發(fā)的模型Watt-tool-70B和Newsbang/homer-72B,登上國際知名AI排行榜榜首。其中,Watt-tool-70B是由盛大旗下Watt團隊研發(fā)的旗艦?zāi)P?,目前位列BFCL Leaderboard總榜單第一。
據(jù)悉,榜單BFCL Leaderboard是由加州大學伯克利分校開發(fā)的評估LLM工具調(diào)用能力基準測試平臺。作為目前大語言模型(LLM)最熱門的研究方向之一,工具調(diào)用(Function-Calling)是為了讓LLM理解,并能準確使用API(應(yīng)用程序編程接口),來執(zhí)行更復(fù)雜而具體的任務(wù)。在近期公布的最新一輪評估結(jié)果中,Watt的“多輪對話執(zhí)行能力”相較于排名第二的GPT-4o 領(lǐng)先11分,比排名第十的Gemini-1.5-Pro 領(lǐng)先近40分。
“這個模型將加速大模型落地‘融合’過程?!盬att有關(guān)負責人說,還有助于從底層數(shù)據(jù)標注到人機交互的體系化建設(shè),讓大模型初步實現(xiàn)從“光說不練”到“能文能武”。
此外,由盛大集團NewsBang團隊開發(fā)的Newsbang/homer-72B 模型位列Open LLM LeaderBoard v2榜單第一。Open LLM Leaderboard V2是由Hugging Face維護的開源語言模型評測平臺升級版本,采用更全面和嚴格評估標準,對各類開源大語言模型進行多維度測試和排名。Newsbang/homer-72B重視提升模型在推理和思考方面的能力,通過搭配數(shù)據(jù)篩選機制等,在多個核心評測維度,該模型性能有了大幅提升。
據(jù)公開報道,2023年初,盛大集團宣布All in AI戰(zhàn)略,去年10月,聯(lián)合多家高校發(fā)表了AI與長期記憶方面的論文,其自研的OMNE大模型多智能體框架登上GAIA 基準測試排行榜榜首;其旗下的天橋腦科學研究院(TCCI)與國際學術(shù)雜志《Science》合作推出全球AI驅(qū)動科學大獎,舉辦和支持包括“AI+精神健康”在內(nèi)的各種高水平國際會議和夏校項目,助力培養(yǎng)跨學科青年AI人才等。
未經(jīng)數(shù)字化報網(wǎng)授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
特別提醒:如內(nèi)容、圖片、視頻出現(xiàn)侵權(quán)問題,請發(fā)送郵箱:tousu_ts@sina.com。
風險提示:數(shù)字化報網(wǎng)呈現(xiàn)的所有信息僅作為學習分享,不構(gòu)成投資建議,一切投資操作信息不能作為投資依據(jù)。本網(wǎng)站所報道的文章資料、圖片、數(shù)據(jù)等信息來源于互聯(lián)網(wǎng),僅供參考使用,相關(guān)侵權(quán)責任由信息來源第三方承擔。
數(shù)字化報(數(shù)字化商業(yè)報告)是國內(nèi)數(shù)字經(jīng)濟創(chuàng)新門戶網(wǎng)站,以數(shù)字技術(shù)創(chuàng)新發(fā)展為中心,融合數(shù)字經(jīng)濟和實體經(jīng)濟發(fā)展,聚焦制造業(yè)、服務(wù)業(yè)、農(nóng)業(yè)等產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型,致力為讀者提供最新、最權(quán)威、最全面的科技和數(shù)字領(lǐng)域資訊。數(shù)字化報并非新聞媒體,不提供新聞信息服務(wù),提供商業(yè)信息服務(wù);
商務(wù)合作:Hezuo@szhww.com
稿件投訴:help@szhww.com
Copyright ? 2013-2023 數(shù)字化報(數(shù)字化報商業(yè)報告)
數(shù)字化報并非新聞媒體,不提供新聞信息服務(wù),提供商業(yè)信息服務(wù)
浙ICP備2023000407號數(shù)字化報網(wǎng)(杭州)信息科技有限公司 版權(quán)所有浙公網(wǎng)安備 33012702000464號