Qwen3：阿里巴巴最新開源的混合推理大模型

AIHubAI布道師

Qwen3是什么？

Qwen3 是阿里巴巴推出的新一代混合推理大模型，支持119種語言，具備強大的推理、編碼和智能體能力。它引入了“思考模式”和“快速響應模式”雙模式切換，能根據任務靈活調節推理深度。Qwen3發布了多種規模的開源模型，旗艦版Qwen3-235B-A22B在多個領域性能達到業界頂尖，廣泛應用于自然語言理解、復雜推理、代碼生成等場景。

Qwen3的主要特點

混合推理模型：
- 2款混合專家（MoE）模型：包含 30B（3B激活）和 235B（22B激活）。
- 6款稠密模型（Dense）：包含 0.6B、1.7B、4B、8B、14B 和 32B 。
多種思考模式：
- 思考模式：在這種模式下，模型會逐步推理，經過深思熟慮后給出最終答案。這種方法非常適合需要深入思考的復雜問題。
- 非思考模式：在此模式中，模型提供快速、近乎即時的響應，適用于那些對速度要求高于深度的簡單問題。
多語言支持：Qwen3支持119種語言和方言，相比Qwen2的29種語言，語言能力大幅提升。
增強的 Agent 能力：強化了代碼生成、調用外部工具（MCP協議）等能力，提升智能體交互與決策水平。
顯著增強的推理能力：在數學、代碼生成和常識邏輯推理方面超越了之前的 QwQ（在思考模式下）和 Qwen2.5 指令模型（在非思考模式下）。
卓越的人類偏好對齊，在創意寫作、角色扮演、多輪對話和指令跟隨方面表現出色，提供更自然、更吸引人和更具沉浸感的對話體驗。