Phi-3：微軟推出的開源小型語言模型，支持移動(dòng)設(shè)備

AI訓(xùn)練模型
24年4月23日
編輯

AIHubAI布道師

Phi-3 是什么？

Phi-3 是微軟 AI 研究院公布的一系列小型語言模型，開源可商用。Phi-3 系列包括三種模型：Phi-3-Mini、Phi-3-Small 和 Phi-3-Medium，它們?cè)诒３州^小模型尺寸的同時(shí)，還能提供與大型模型相媲美的性能。這些模型特別適合于需要快速響應(yīng)和低延遲的應(yīng)用場(chǎng)景，同時(shí)還能減少對(duì)帶寬和存儲(chǔ)的需求，例如在移動(dòng)設(shè)備或者邊緣計(jì)算設(shè)備上。

Phi-3模型組成：

Phi-3-mini：mini是3.8B 的參數(shù)，3.3T token 訓(xùn)練數(shù)據(jù)。在多個(gè)學(xué)術(shù)基準(zhǔn)測(cè)試中，Phi-3-mini 性能接近或等同于市場(chǎng)上的大型模型，例如在 MMLU 測(cè)試中得分為 69%，在 MT-bench 測(cè)試中得分為 8.38 分。
Phi-3-small：Small 是 7B 參數(shù)，4.8T token 訓(xùn)練數(shù)據(jù)，MMLU 75%，MT-bench 8.7 分。?
Phi-3-medium： Medium 是 14B 參數(shù)，4.8T token 訓(xùn)練數(shù)據(jù)，MMLU 78%，MT-bench ?8.9 分。

Phi-3的模型特色和優(yōu)勢(shì)

小型化：Phi-3 模型的體積小，特別是 Phi-3-Mini，只有 3.8B 參數(shù)，這使得模型可以在資源受限的設(shè)備上運(yùn)行。
高性能：盡管模型小型化，Phi-3 在多個(gè)學(xué)術(shù)基準(zhǔn)測(cè)試中表現(xiàn)出接近或等同于市場(chǎng)上大型模型的性能。
快速響應(yīng)：Phi-3-Mini 能夠在 iPhone 上每秒生成 16 個(gè) token 的信息，這意味著它可以在移動(dòng)設(shè)備上實(shí)現(xiàn)快速響應(yīng)。
離線能力：Phi-3 模型支持離線運(yùn)行，不需要互聯(lián)網(wǎng)連接，這有助于保護(hù)用戶隱私并減少對(duì)網(wǎng)絡(luò)帶寬的依賴。
多語言支持：Phi-3 的 Small 和 Medium 版本包含了多語言數(shù)據(jù)，雖然 Phi-3-Mini 主要處理英文，但未來可能會(huì)支持更多語言。
節(jié)省資源：Phi-3 的內(nèi)存占用相對(duì)較低，這使得它能夠在配置較低的設(shè)備上運(yùn)行，而不會(huì)顯著影響設(shè)備性能。
易于集成：由于其小型化和高效性，Phi-3 模型可以輕松集成到各種應(yīng)用中，包括移動(dòng)應(yīng)用、嵌入式系統(tǒng)和物聯(lián)網(wǎng)設(shè)備。
定制應(yīng)用：小型模型如 Phi-3 更適合于定制化應(yīng)用，特別是對(duì)于那些數(shù)據(jù)集較小或需要特定領(lǐng)域優(yōu)化的企業(yè)。
成本效益：相比于大型模型，小型模型通常在計(jì)算資源和能源消耗上更為經(jīng)濟(jì)，有助于降低運(yùn)營(yíng)成本。
易于部署：小型模型易于在本地設(shè)備上部署，有助于實(shí)現(xiàn)快速的數(shù)據(jù)處理和響應(yīng)，同時(shí)減少對(duì)云服務(wù)的依賴。

Phi-3 模型的這些優(yōu)勢(shì)使其成為在資源受限或需要快速、本地化處理的自然語言處理應(yīng)用中的理想選擇。

Phi-3的技術(shù)框架

Transformer 解碼器架構(gòu)：Phi-3-Mini 采用了為移動(dòng)設(shè)備優(yōu)化的架構(gòu)，支持通過 LongRope 系統(tǒng)擴(kuò)展上下文長(zhǎng)度。
結(jié)構(gòu)設(shè)計(jì)：Phi-3-Mini 與 Llama-2 模型結(jié)構(gòu)相似，使用了相同的分詞器，保證了與 Llama-2 系列軟件包的兼容性。
分組查詢和塊狀稀疏注意力機(jī)制：Small 和 Medium 版本引入了這些機(jī)制，以優(yōu)化長(zhǎng)期上下文檢索性能并減少內(nèi)存占用。
數(shù)據(jù)訓(xùn)練：使用網(wǎng)頁數(shù)據(jù)和合成數(shù)據(jù)進(jìn)行訓(xùn)練，分為兩個(gè)階段，第一階段注重通用知識(shí)和語言理解，第二階段培養(yǎng)邏輯推理和特定技能。
訓(xùn)練方法：Phi-3 的訓(xùn)練方法受到兒童學(xué)習(xí)方式的啟發(fā)，采用“課程”式訓(xùn)練，使用簡(jiǎn)化的“兒童讀物”來教導(dǎo)模型。

如何使用Phi-3？

微軟提供了Phi-3的技術(shù)報(bào)告、在線體驗(yàn)和模型下載地址：

在線體驗(yàn)地址：https://huggingface.co/chat/models/microsoft/Phi-3-mini-4k-instruct
模型下載地址：https://huggingface.co/collections/microsoft/phi-3-6626e15e9585a200d2d761e3
技術(shù)報(bào)告鏈接：https://arxiv.org/abs/2404.14219

總之，Phi-3 系列模型的推出，展示了微軟在小型化、高效能語言模型領(lǐng)域的最新進(jìn)展，特別是在移動(dòng)設(shè)備上的應(yīng)用潛力。

?版權(quán)聲明：如無特殊說明，本站所有內(nèi)容均為AIHub.cn原創(chuàng)發(fā)布和所有。任何個(gè)人或組織，在未征得本站同意時(shí)，禁止復(fù)制、盜用、采集、發(fā)布本站內(nèi)容到任何網(wǎng)站、書籍等各類媒體平臺(tái)。否則，我站將依法保留追究相關(guān)法律責(zé)任的權(quán)利。