欧美成人三级视频网站,国产一区国产二区国产三区,青青久久av北条麻妃黑人,亚州综合一区

訊飛智文
當前位置:首頁>AI工具>AI訓練模型>訊飛星火開源大模型

訊飛星火開源大模型

訊飛星火開源大模型

訊飛星火開源大模型是什么?

訊飛星火開源大模型是科大訊飛對外開源的大模型。訊飛星火開源-13B(iFlytekSpark-13B)擁有130億參數(shù),在經過累計超過3萬億以上tokens海量高質量數(shù)據集上進行預訓練,然后在精調的多元化對齊數(shù)據上進行微調得到。iFlytekSpark-13B在多個標準評估中展現(xiàn)出了卓越的性能,其表現(xiàn)優(yōu)于同參數(shù)量級的開源模型,與一些閉源模型相比不相上下。

iFlytekSpark-13B不僅具備通用任務處理能力如聊天、問答、文本提取和分類等,還具備數(shù)據分析和代碼生成等生產力功能。我們特別在學習輔助、數(shù)學、推理等領域進行了深度優(yōu)化,大幅提升模型的實用性和易用性。詳細的評測結果見下面評測部分。

官網鏈接:https://xinghuo.xfyun.cn/openSource

?訊飛星火認知大模型V3.5正式發(fā)布,立即免費使用:https://xinghuo.xfyun.cn/

訊飛星火開源大模型的評估效果

在八個具有挑戰(zhàn)性的中英文測試集上對模型進行性能評估。其中chat模型采用0-shot進行測試,base模型在C-EVAL,MMLU,CMMLU,F(xiàn)inanceIQ測試集上采用5-shot進行測試,其余測試集采用0-shot進行測試。

  • C-EVAL:C-Eval 是一個全面的中文基礎模型評估套件,涵蓋了52個不同的學科和四個難度級別,驗證集包括1346個選擇題,測試集包含12342個選擇題。本項目采用C-Eval驗證集進行測試。
  • MMLU:MMLU 是一個龐大的多任務數(shù)據集,由各種學科的多項選擇題組成。其中包括57個任務,涵蓋了人文學科、社會科學、自然科學和其他對某些人學習很重要的領域。
  • CMMLU:CMMLU 是一個綜合性的中文評估基準,涵蓋了從基礎學科到高級專業(yè)水平的67個主題。涵蓋了自然科學、人文科學和社會科學等領域。
  • AGIEVAL:AGIEval 是一個專門為評估基礎模型在以人類為中心的標準化考試(如大學入學考試、法學院入學考試、數(shù)學競賽和律師資格考試)的語境中而設計的基準測試。
  • ARC:包含了ARC-E和ARC-C,它們分別是ARC數(shù)據集中的簡單集和挑戰(zhàn)集,分別有5197 和2590 個問題。這些問題是僅文本的英語語言考試問題,跨越了多個年級水平。
  • GaoKao:GaoKao收集了從 2010 年到 2022 年的高考試題,包括 1781 道客觀題和 1030 道主觀題。本項目報告結果為GaoKao中客觀題結果。
  • FinanceIQ:FinanceIQ 是一個專注于金融領域的中文評估數(shù)據集,涵蓋了10個金融大類及36個金融小類,總計7173個單項選擇題。
C_EVALMMLUCMMLUAGIEVALARC_EARC_CGaoKaoFinanceIQ平均
iFlytekSpark-13B-base70.8858.7670.0150.4484.7871.1656.4260.2165.33
iFlytekSpark-13B-chat82.5463.0275.6956.9689.4777.3467.4965.4872.25

如何使用訊飛星火開源大模型?

?版權聲明:如無特殊說明,本站所有內容均為AIHub.cn原創(chuàng)發(fā)布和所有。任何個人或組織,在未征得本站同意時,禁止復制、盜用、采集、發(fā)布本站內容到任何網站、書籍等各類媒體平臺。否則,我站將依法保留追究相關法律責任的權利。 Trae
0 條回復 A文章作者 M管理員
    暫無評論內容
error:
主站蜘蛛池模板: 清远市| 峨眉山市| 江达县| 太康县| 醴陵市| 仁怀市| 华容县| 桂东县| 望江县| 新沂市| 上思县| 镇江市| 墨竹工卡县| 镇沅| 凤台县| 威远县| 朔州市| 如东县| 长沙县| 德保县| 安国市| 宁晋县| 平泉县| 康平县| 白城市| 长治市| 阳泉市| 博客| 八宿县| 镇坪县| 怀集县| 齐齐哈尔市| 利川市| 乌拉特后旗| 邵武市| 吐鲁番市| 江油市| 新竹市| 竹山县| 克拉玛依市| 页游|