9 月 6 日消息,百川智能今日召開主題為“百川匯海,開源共贏”的大模型發布會,正式開源微調后的 Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat 與其 4bit 量化版本,并且均為免費可商用。

百川智能此次還開源了模型訓練的 Check Point,并宣布將發布 Baichuan 2 技術報告,詳細介紹 Baichuan 2 的訓練細節,IT之家附 Baichuan 2 下載地址:https://github.com/baichuan-inc/Baichuan2
據百川智能官方介紹,Baichuan2-7B-Base 和 Baichuan2-13B-Base,均基于 2.6 萬億高質量多語言數據進行訓練,兩個模型在數學、代碼、安全、邏輯推理、語義理解等能力有顯著提升。
其中 Baichuan2-13B-Base 相比上一代 13B 模型,數學能力提升 49%,代碼能力提升 46%,安全能力提升 37%,邏輯推理能力提升 25%,語義理解能力提升 15%。

在 MMLU、CMMLU、GSM8K 等基準測試中,百川智能的兩個模型都比 LLaMA 2 的分數要高一些,且在“中文通用”部分優勢較大。


Baichuan2-7B 和 Baichuan2-13B 不僅對學術研究完全開放,開發者也僅需郵件申請獲得官方商用許可后,即可以免費商用。騰訊云、阿里云、火山方舟、華為、聯發科等企業均參加了本次發布會并與百川智能達成了合作。
?版權聲明:如無特殊說明,本站所有內容均為AIHub.cn原創發布和所有。任何個人或組織,在未征得本站同意時,禁止復制、盜用、采集、發布本站內容到任何網站、書籍等各類媒體平臺。否則,我站將依法保留追究相關法律責任的權利。

