abab 6.5-MiniMax稀宇科技發(fā)布的萬億參數(shù)MoE大模型

AI訓(xùn)練模型
24年4月18日
編輯

AIHubAI布道師

abab 6.5是什么？

abab 6.5是國內(nèi) AI 初創(chuàng)企業(yè)?MiniMax 稀宇科技今日正式推出的?MoE 混合專家模型架構(gòu)的系列大模型，核心能力開始接近?GPT-4、 Claude-3、 Gemini-1.5。

abab 6.5 系列包含兩個(gè)模型：

abab 6.5：包含萬億參數(shù)，支持 200k tokens 的上下文長度；
abab 6.5s：與 abab 6.5 使用了同樣的訓(xùn)練技術(shù)和數(shù)據(jù)，但是更高效，支持 200k tokens 的上下文長度，可以 1 秒內(nèi)處理近 3 萬字的文本。

abab 6.5-MiniMax稀宇科技發(fā)布的萬億參數(shù)MoE大模型

abab 6.5的核心能力測試

性能對(duì)比：在知識(shí)、推理、數(shù)學(xué)、編程、指令遵從等維度上，abab 6.5開始接近GPT-4、Claude-3、Gemini-1.5等世界上最領(lǐng)先的大語言模型。

大海撈針測試：在200k token內(nèi)進(jìn)行的測試中，模型需要在長文本中識(shí)別并準(zhǔn)確回答一個(gè)無關(guān)的句子（針）。在891次測試中，abab 6.5均能正確回答。

如何使用abab 6.5？

abab 6.5 和 abab 6.5s 會(huì)滾動(dòng)更新到 MiniMax 旗下的產(chǎn)品中，包括生產(chǎn)力產(chǎn)品海螺 AI 和 MiniMax 開放平臺(tái)上。如果有興趣，大家可以去試試。

?版權(quán)聲明：如無特殊說明，本站所有內(nèi)容均為AIHub.cn原創(chuàng)發(fā)布和所有。任何個(gè)人或組織，在未征得本站同意時(shí)，禁止復(fù)制、盜用、采集、發(fā)布本站內(nèi)容到任何網(wǎng)站、書籍等各類媒體平臺(tái)。否則，我站將依法保留追究相關(guān)法律責(zé)任的權(quán)利。