欧美成人三级视频网站,国产一区国产二区国产三区,青青久久av北条麻妃黑人,亚州综合一区

即夢AI
當前位置:首頁>AI模型>Qwen2-阿里云最新發布的通義千問開源大模型

Qwen2-阿里云最新發布的通義千問開源大模型

Qwen2是什么?

Qwen2是阿里云通義千問團隊開源的新一代大語言模型,推出了5個尺寸的預訓練和指令微調模型,在中文英語的基礎上,訓練數據中增加了27種語言相關的高質量數據;代碼和數學能力顯著提升;增大了上下文長度支持,最高達到128K?tokens(Qwen2-72B-Instruct)。多個評測基準上的領先表現。現已在Hugging Face和ModelScope開源。

Qwen2系列包含5個尺寸的預訓練和指令微調模型,其中包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B。如下表所示:

模型Qwen2-0.5BQwen2-1.5BQwen2-7BQwen2-57B-A14BQwen2-72B
參數量0.49B1.54B7.07B57.41B72.71B
非Embedding參數量0.35B1.31B5.98B56.32B70.21B
GQATrueTrueTrueTrueTrue
Tie EmbeddingTrueTrueFalseFalseFalse
上下文長度32K32K128K64K128K
Qwen2-阿里云最新發布的通義千問開源大模型

Qwen2的亮點特性

1、代碼 & 數學:在代碼方面,Qwen2實現了在多種編程語言上的顯著效果提升。而在數學方面,大規模且高質量的數據幫助Qwen2-72B-Instruct實現了數學解題能力的飛升。

Qwen2-阿里云最新發布的通義千問開源大模型

2、長文本處理:Qwen2-7B-Instruct幾乎完美地處理長達128k的上下文;Qwen2-57B-A14B-Instruct則能處理64k的上下文長度;而該系列中的兩個較小模型則支持32k的上下文長度。

Qwen2-阿里云最新發布的通義千問開源大模型

3、安全方面:通過顯著性檢驗(P值),Qwen2-72B-Instruct模型在安全性方面與GPT-4的表現相當,并且顯著優于Mistral-8x22B模型。

Qwen2的性能評測

相比Qwen1.5,Qwen2在大規模模型實現了非常大幅度的效果提升。在針對預訓練語言模型的評估中,對比當前最優的開源模型,Qwen2-72B在包括自然語言理解、知識、代碼、數學及多語言等多項能力上均顯著超越當前領先的模型,如Llama-3-70B以及Qwen1.5最大的模型Qwen1.5-110B。

Qwen2-阿里云最新發布的通義千問開源大模型

Qwen2-72B-Instruct在提升基礎能力以及對齊人類價值觀這兩方面取得了較好的平衡。相比Qwen1.5的72B模型,Qwen2-72B-Instruct在所有評測中均大幅超越,并且了取得了匹敵Llama-3-70B-Instruct的表現。

Qwen2-阿里云最新發布的通義千問開源大模型

在小模型方面,Qwen2系列模型基本能夠超越同等規模的最優開源模型甚至更大規模的模型。相比近期推出的最好的模型,Qwen2-7B-Instruct依然能在多個評測上取得顯著的優勢,尤其是代碼及中文理解上。

Qwen2-阿里云最新發布的通義千問開源大模型

如何使用Qwen2?

目前,Qwen2已在Hugging Face和ModelScope上同步開源,相關資源地址如下:

阿里云基于Qwen2的AI編程助手通義靈碼正式上線,如有興趣,可以試試。

?版權聲明:如無特殊說明,本站所有內容均為AIHub.cn原創發布和所有。任何個人或組織,在未征得本站同意時,禁止復制、盜用、采集、發布本站內容到任何網站、書籍等各類媒體平臺。否則,我站將依法保留追究相關法律責任的權利。 Trae
主站蜘蛛池模板: 扬中市| 孟州市| 闸北区| 怀来县| 察哈| 易门县| 北流市| 石渠县| 神池县| 大化| 武汉市| 广德县| 庄浪县| 凯里市| 池州市| 温泉县| 浦江县| 防城港市| 溧水县| 简阳市| 古交市| 老河口市| 洛川县| 张北县| 兴安盟| 和龙市| 浦北县| 昭平县| 威海市| 武陟县| 长兴县| 开化县| 鸡泽县| 怀安县| 凤庆县| 德江县| 岱山县| 都兰县| 章丘市| 凉城县| 龙门县|