欧美成人三级视频网站,国产一区国产二区国产三区,青青久久av北条麻妃黑人,亚州综合一区

訊飛智文
當(dāng)前位置:首頁>AI工具>AI訓(xùn)練模型>Phi-3:微軟推出的開源小型語言模型,支持移動(dòng)設(shè)備

Phi-3:微軟推出的開源小型語言模型,支持移動(dòng)設(shè)備

Phi-3 是什么?

Phi-3 是微軟 AI 研究院公布的一系列小型語言模型,開源可商用。Phi-3 系列包括三種模型:Phi-3-Mini、Phi-3-Small 和 Phi-3-Medium,它們?cè)诒3州^小模型尺寸的同時(shí),還能提供與大型模型相媲美的性能。這些模型特別適合于需要快速響應(yīng)和低延遲的應(yīng)用場(chǎng)景,同時(shí)還能減少對(duì)帶寬和存儲(chǔ)的需求,例如在移動(dòng)設(shè)備或者邊緣計(jì)算設(shè)備上。

Phi-3模型組成:

  • Phi-3-mini:mini是3.8B 的參數(shù),3.3T token 訓(xùn)練數(shù)據(jù)。在多個(gè)學(xué)術(shù)基準(zhǔn)測(cè)試中,Phi-3-mini 性能接近或等同于市場(chǎng)上的大型模型,例如在 MMLU 測(cè)試中得分為 69%,在 MT-bench 測(cè)試中得分為 8.38 分。
  • Phi-3-small:Small 是 7B 參數(shù),4.8T token 訓(xùn)練數(shù)據(jù),MMLU 75%,MT-bench 8.7 分。?
  • Phi-3-medium: Medium 是 14B 參數(shù),4.8T token 訓(xùn)練數(shù)據(jù),MMLU 78%,MT-bench ?8.9 分。
Phi-3:微軟推出的開源小型語言模型,支持移動(dòng)設(shè)備

Phi-3的模型特色和優(yōu)勢(shì)

  • 小型化:Phi-3 模型的體積小,特別是 Phi-3-Mini,只有 3.8B 參數(shù),這使得模型可以在資源受限的設(shè)備上運(yùn)行。
  • 高性能:盡管模型小型化,Phi-3 在多個(gè)學(xué)術(shù)基準(zhǔn)測(cè)試中表現(xiàn)出接近或等同于市場(chǎng)上大型模型的性能。
  • 快速響應(yīng):Phi-3-Mini 能夠在 iPhone 上每秒生成 16 個(gè) token 的信息,這意味著它可以在移動(dòng)設(shè)備上實(shí)現(xiàn)快速響應(yīng)。
  • 離線能力:Phi-3 模型支持離線運(yùn)行,不需要互聯(lián)網(wǎng)連接,這有助于保護(hù)用戶隱私并減少對(duì)網(wǎng)絡(luò)帶寬的依賴。
  • 多語言支持:Phi-3 的 Small 和 Medium 版本包含了多語言數(shù)據(jù),雖然 Phi-3-Mini 主要處理英文,但未來可能會(huì)支持更多語言。
  • 節(jié)省資源:Phi-3 的內(nèi)存占用相對(duì)較低,這使得它能夠在配置較低的設(shè)備上運(yùn)行,而不會(huì)顯著影響設(shè)備性能。
  • 易于集成:由于其小型化和高效性,Phi-3 模型可以輕松集成到各種應(yīng)用中,包括移動(dòng)應(yīng)用、嵌入式系統(tǒng)和物聯(lián)網(wǎng)設(shè)備。
  • 定制應(yīng)用:小型模型如 Phi-3 更適合于定制化應(yīng)用,特別是對(duì)于那些數(shù)據(jù)集較小或需要特定領(lǐng)域優(yōu)化的企業(yè)。
  • 成本效益:相比于大型模型,小型模型通常在計(jì)算資源和能源消耗上更為經(jīng)濟(jì),有助于降低運(yùn)營(yíng)成本。
  • 易于部署:小型模型易于在本地設(shè)備上部署,有助于實(shí)現(xiàn)快速的數(shù)據(jù)處理和響應(yīng),同時(shí)減少對(duì)云服務(wù)的依賴。

Phi-3 模型的這些優(yōu)勢(shì)使其成為在資源受限或需要快速、本地化處理的自然語言處理應(yīng)用中的理想選擇。

Phi-3的技術(shù)框架

  1. Transformer 解碼器架構(gòu):Phi-3-Mini 采用了為移動(dòng)設(shè)備優(yōu)化的架構(gòu),支持通過 LongRope 系統(tǒng)擴(kuò)展上下文長(zhǎng)度。
  2. 結(jié)構(gòu)設(shè)計(jì):Phi-3-Mini 與 Llama-2 模型結(jié)構(gòu)相似,使用了相同的分詞器,保證了與 Llama-2 系列軟件包的兼容性。
  3. 分組查詢和塊狀稀疏注意力機(jī)制:Small 和 Medium 版本引入了這些機(jī)制,以優(yōu)化長(zhǎng)期上下文檢索性能并減少內(nèi)存占用。
  4. 數(shù)據(jù)訓(xùn)練:使用網(wǎng)頁數(shù)據(jù)和合成數(shù)據(jù)進(jìn)行訓(xùn)練,分為兩個(gè)階段,第一階段注重通用知識(shí)和語言理解,第二階段培養(yǎng)邏輯推理和特定技能。
  5. 訓(xùn)練方法:Phi-3 的訓(xùn)練方法受到兒童學(xué)習(xí)方式的啟發(fā),采用“課程”式訓(xùn)練,使用簡(jiǎn)化的“兒童讀物”來教導(dǎo)模型。

如何使用Phi-3?

微軟提供了Phi-3的技術(shù)報(bào)告、在線體驗(yàn)和模型下載地址:

總之,Phi-3 系列模型的推出,展示了微軟在小型化、高效能語言模型領(lǐng)域的最新進(jìn)展,特別是在移動(dòng)設(shè)備上的應(yīng)用潛力。

?版權(quán)聲明:如無特殊說明,本站所有內(nèi)容均為AIHub.cn原創(chuàng)發(fā)布和所有。任何個(gè)人或組織,在未征得本站同意時(shí),禁止復(fù)制、盜用、采集、發(fā)布本站內(nèi)容到任何網(wǎng)站、書籍等各類媒體平臺(tái)。否則,我站將依法保留追究相關(guān)法律責(zé)任的權(quán)利。 Trae
0 條回復(fù) A文章作者 M管理員
    暫無評(píng)論內(nèi)容
error:
主站蜘蛛池模板: 涟水县| 临泽县| 南岸区| 苗栗县| 云梦县| 双鸭山市| 玉山县| 逊克县| 仁寿县| 温泉县| 泸水县| 东阳市| 九寨沟县| 南城县| 沽源县| 阳东县| 鄯善县| 高邮市| 江安县| 大兴区| 兴山县| 疏勒县| 晋中市| 卓尼县| 庆元县| 鹤岗市| 印江| 延庆县| 玉田县| SHOW| 阿图什市| 清徐县| 瓮安县| 喀喇沁旗| 苍南县| 赣州市| 青河县| 金塔县| 株洲市| 泰兴市| 容城县|