獵戶星空大模型是什么?
獵戶星空大模型是獵戶星空發布的一個專為企業應用設計的AI模型,具有140億參數的多語種大模型,該模型在一個包含2.5萬億token的多樣化數據集上進行了訓練,涵蓋了中文、英語、日語、韓語等多種語言。在多語言環境下的一系列任務中展現出卓越的性能。在主流的公開基準評測中,Orion-14B系列模型表現優異,多項指標顯著超越同等參數基本的其他模型。具體技術細節請參考技術報告。
具體而言,Orion-14B系列大語言模型包含:
- Orion-14B-Base:?基于2.5萬億tokens多樣化數據集訓練處的140億參數量級的多語言基座模型。
- Orion-14B-Chat:?基于高質量語料庫微調的對話類模型,旨在為大模型社區提供更好的用戶交互體驗。
- Orion-14B-LongChat:?在200k token長度上效果優異,最長可支持可達320k,在長文本評估集上性能比肩專有模型。
- Orion-14B-Chat-RAG:?在一個定制的檢索增強生成數據集上進行微調的聊天模型,在檢索增強生成任務中取得了卓越的性能。
- Orion-14B-Chat-Plugin:?專門針對插件和函數調用任務定制的聊天模型,非常適用于使用代理的相關場景,其中大語言模型充當插件和函數調用系統。
- Orion-14B-Base-Int4:?一個使用int4進行量化的基座模型。它將模型大小顯著減小了70%,同時提高了推理速度30%,僅引入了1%的最小性能損失。
- Orion-14B-Chat-Int4:?一個使用int4進行量化的對話模型。
獵戶星空大模型性能亮點:
Orion-14B系列大模型有以下幾個特點:
- 基座20B參數級別大模型綜合評測效果表現優異
- 多語言能力強,在日語、韓語測試集上顯著領先
- 微調模型適應性強,在人類標注盲測中,表現突出
- 長上下文版本支持超長文本,在200k token長度上效果優異,最長可支持可達320k
- 量化版本模型大小縮小70%,推理速度提升30%,性能損失小于1%

獵戶星空大模型還提供了多種應用微調選項,如通用對話微調、插件微調、RAG微調、長Token微調、知識抽取微調和問答對生成微調等,以適應不同的企業場景需求。
此外,獵戶星空大模型強調其適合企業應用的特點,如:
- 模型可以在千元級顯卡上運行,如NVIDIA RTX 3060,每秒可處理約50個漢字。
- 支持私有化部署,大模型服務器可以放置在企業內網,確保數據安全。
- 免費開源可商用,提供社區技術支持。
如何使用獵戶星空大模型?
- 官網入口:https://www.orionstar.com/llm.html
- 在線體驗:https://www.modelscope.cn/studios/OrionStarAI/Orion-14B-App-Demo/summary/

?版權聲明:如無特殊說明,本站所有內容均為AIHub.cn原創發布和所有。任何個人或組織,在未征得本站同意時,禁止復制、盜用、采集、發布本站內容到任何網站、書籍等各類媒體平臺。否則,我站將依法保留追究相關法律責任的權利。
