abab 6.5是什么?
abab 6.5是國內(nèi) AI 初創(chuàng)企業(yè)?MiniMax 稀宇科技今日正式推出的?MoE 混合專家模型架構(gòu)的系列大模型,核心能力開始接近?GPT-4、 Claude-3、 Gemini-1.5。
abab 6.5 系列包含兩個(gè)模型:
- abab 6.5:包含萬億參數(shù),支持 200k tokens 的上下文長度;
- abab 6.5s:與 abab 6.5 使用了同樣的訓(xùn)練技術(shù)和數(shù)據(jù),但是更高效,支持 200k tokens 的上下文長度,可以 1 秒內(nèi)處理近 3 萬字的文本。

abab 6.5的核心能力測試
性能對(duì)比:在知識(shí)、推理、數(shù)學(xué)、編程、指令遵從等維度上,abab 6.5開始接近GPT-4、Claude-3、Gemini-1.5等世界上最領(lǐng)先的大語言模型。

大海撈針測試:在200k token內(nèi)進(jìn)行的測試中,模型需要在長文本中識(shí)別并準(zhǔn)確回答一個(gè)無關(guān)的句子(針)。在891次測試中,abab 6.5均能正確回答。
如何使用abab 6.5?
abab 6.5 和 abab 6.5s 會(huì)滾動(dòng)更新到 MiniMax 旗下的產(chǎn)品中,包括生產(chǎn)力產(chǎn)品海螺 AI 和 MiniMax 開放平臺(tái)上。如果有興趣,大家可以去試試。
