DeepSeek-V3-0324是什么?
DeepSeek-V3-0324 是 DeepSeek 團隊發布的小版本升級模型,參數約 660B,上下文長度 128K。該版本在推理任務、前端開發、中文寫作、中文搜索等方面顯著提升,特別是在數學、代碼和百科知識評測中表現優異。
此外,模型采用 MIT 開源許可,支持私有化部署,可通過 Model Scope 或 Hugging Face 下載權重。用戶可在官方網頁、APP 或小程序中關閉深度思考后體驗。
DeepSeek-V3-0324的主要能力提升
- 推理任務表現提高
- 強化學習技術:新版 V3 模型借鑒了 DeepSeek-R1 模型訓練過程中使用的強化學習技術,大幅提高了在推理類任務上的表現水平。
- 評測集表現:在數學、代碼類相關評測集上,新版 V3 模型取得了超過 GPT-4.5 的得分成績。

- 中文寫作升級
- 寫作水平優化:新版 V3 模型在中文寫作任務方面進行了進一步優化,特別提升了中長篇文本創作的內容質量。

- 前端開發能力增強
- 代碼可用性:在 HTML 等代碼前端任務上,新版 V3 模型生成的代碼可用性更高。
- 視覺效果:生成的視覺效果更加美觀、富有設計感。
- 中文搜索能力優化
- 聯網搜索:在聯網搜索場景下,新版 V3 模型能夠輸出更詳實準確、排版更清晰美觀的結果。
- 其他能力提升
- 工具調用:能力提升。
- 角色扮演:能力提升。
- 問答閑聊:能力提升。
如何使用DeepSeek-V3-0324?
- 在線體驗:用戶登錄官方網頁、APP、小程序進入對話界面后,關閉深度思考即可體驗。
- API 接口:API 接口和使用方式保持不變。
- 模型開源信息:
- 模型參數:約 660B 參數。
- 上下文長度:開源版本上下文長度為 128K(網頁端、App 和 API 提供 64K 上下文)。
- 私有化部署:私有化部署時只需更新 checkpoint 和 tokenizer_config.json(tool calls 相關變動)。
- 開源許可:采用 MIT License,允許用戶利用模型輸出、通過模型蒸餾等方式訓練其他模型。
- 權重下載:
?版權聲明:如無特殊說明,本站所有內容均為AIHub.cn原創發布和所有。任何個人或組織,在未征得本站同意時,禁止復制、盜用、采集、發布本站內容到任何網站、書籍等各類媒體平臺。否則,我站將依法保留追究相關法律責任的權利。
