k0-math是什么?
k0-math是由月之暗面公司推出的專注于數(shù)學(xué)推理能力的新一代AI模型,采用了全新的強化學(xué)習(xí)和思維鏈推理技術(shù),通過模擬人腦的思考和反思過程,大幅提升了解決數(shù)學(xué)難題的能力,可以幫助用戶完成更具挑戰(zhàn)性的數(shù)學(xué)任務(wù) 。該模型在中考、高考、考研及入門競賽題等基礎(chǔ)數(shù)學(xué)測試中的表現(xiàn)超越了OpenAI的o1-mini和o1-preview模型,在OMNI-MATH和AIME等高難度競賽題庫中也分別達到了o1-mini最高成績的90%和83%的水平。

k0-math的性能表現(xiàn)
在多項數(shù)學(xué)基準(zhǔn)能力測試中,k0-math 的表現(xiàn)能對標(biāo) OpenAI o1 系列可公開使用的兩個模型:o1-mini 和 o1-preview。在中考、高考、考研以及包含入門競賽題的 MATH 等 4 個數(shù)學(xué)基準(zhǔn)測試中,k0-math 初代模型成績超過 o1-mini 和 o1-preview 模型。
在業(yè)界最常使用的數(shù)學(xué)能力基準(zhǔn)測試 MATH 中,k0-math 模型得分 93.8,超過 o1-mini 的 90 分和 o1-preview 的 85.5 分。k0-math 這一成績僅次于暫未開放使用的 o1 完全版 94.8 分。
在兩個難度更大的競賽級別的數(shù)學(xué)題庫 OMNI-MATH 和 AIME 基準(zhǔn)測試中,k0-math 初代模型的表現(xiàn)分別達到了 o1-mini 最高成績的 90% 和 83%。接下來,k0-math 模型會持續(xù)迭代,提升更難題目的解題能力,挑戰(zhàn)數(shù)學(xué)模型的能力極限。

如何體驗k0-math?
據(jù)官方消息,k0-math模型將在未來幾周通過Kimi網(wǎng)頁版和App端陸續(xù)向用戶開放使用,幫助大家解決更有挑戰(zhàn)的數(shù)學(xué)和搜索調(diào)研類任務(wù)。


