Qwen2.5：阿里巴巴最新開源的系列AI大模型

AI訓練模型
24年9月19日
編輯

AIHubAI布道師

Qwen2.5是什么？

Qwen是阿里巴巴集團Qwen團隊研發的大語言模型和大型多模態模型系列。目前，大語言模型已升級至Qwen2.5版本。無論是語言模型還是多模態模型，均在大規模多語言和多模態數據上進行預訓練，并通過高質量數據進行后期微調以貼近人類偏好。Qwen具備自然語言理解、文本生成、視覺理解、音頻理解、工具使用、角色扮演、作為AI Agent進行互動等多種能力。

Qwen2.5的主要特點

參數規模多樣：易于使用的僅解碼器稠密語言模型，提供?0.5B?、1.5B?、3B?、7B?、14B?、32B?和?72B?共7種參數規模的模型，并且有基模型和指令微調模型兩種變體（其中“ B ”表示“十億”， 72B 即為 720 億）
大規模數據預訓練：利用我們最新的數據集進行預訓練，包含多達 18T tokens （其中“ T ”表示“萬億”， 18T 即為 18 萬億）
長文本處理能力：在遵循指令、生成長文本（超過 8K tokens ）、理解結構化數據（例如，表格）以及生成結構化輸出特別是 JSON 方面有了顯著改進
指令遵循與改進：更加適應多樣化的系統提示，增強了角色扮演的實現和聊天機器人的背景設置。
上下文理解：支持最多達?128K?tokens 的上下文長度，并能生成多達?8K?tokens 的文本。
多語言支持：支持超過?29?種語言，包括中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文、韓文、越南文、泰文、阿拉伯文等。