欧美成人三级视频网站,国产一区国产二区国产三区,青青久久av北条麻妃黑人,亚州综合一区

訊飛智文
當(dāng)前位置:首頁(yè)>AI工具>AI訓(xùn)練模型>Qwen2-阿里云最新發(fā)布的通義千問(wèn)開(kāi)源大模型

Qwen2-阿里云最新發(fā)布的通義千問(wèn)開(kāi)源大模型

Qwen2是什么?

Qwen2是阿里云通義千問(wèn)團(tuán)隊(duì)開(kāi)源的新一代大語(yǔ)言模型,推出了5個(gè)尺寸的預(yù)訓(xùn)練和指令微調(diào)模型,在中文英語(yǔ)的基礎(chǔ)上,訓(xùn)練數(shù)據(jù)中增加了27種語(yǔ)言相關(guān)的高質(zhì)量數(shù)據(jù);代碼和數(shù)學(xué)能力顯著提升;增大了上下文長(zhǎng)度支持,最高達(dá)到128K?tokens(Qwen2-72B-Instruct)。多個(gè)評(píng)測(cè)基準(zhǔn)上的領(lǐng)先表現(xiàn)。現(xiàn)已在Hugging Face和ModelScope開(kāi)源。

Qwen2系列包含5個(gè)尺寸的預(yù)訓(xùn)練和指令微調(diào)模型,其中包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B。如下表所示:

模型Qwen2-0.5BQwen2-1.5BQwen2-7BQwen2-57B-A14BQwen2-72B
參數(shù)量0.49B1.54B7.07B57.41B72.71B
非Embedding參數(shù)量0.35B1.31B5.98B56.32B70.21B
GQATrueTrueTrueTrueTrue
Tie EmbeddingTrueTrueFalseFalseFalse
上下文長(zhǎng)度32K32K128K64K128K
Qwen2-阿里云最新發(fā)布的通義千問(wèn)開(kāi)源大模型

Qwen2的亮點(diǎn)特性

1、代碼 & 數(shù)學(xué):在代碼方面,Qwen2實(shí)現(xiàn)了在多種編程語(yǔ)言上的顯著效果提升。而在數(shù)學(xué)方面,大規(guī)模且高質(zhì)量的數(shù)據(jù)幫助Qwen2-72B-Instruct實(shí)現(xiàn)了數(shù)學(xué)解題能力的飛升。

Qwen2-阿里云最新發(fā)布的通義千問(wèn)開(kāi)源大模型

2、長(zhǎng)文本處理:Qwen2-7B-Instruct幾乎完美地處理長(zhǎng)達(dá)128k的上下文;Qwen2-57B-A14B-Instruct則能處理64k的上下文長(zhǎng)度;而該系列中的兩個(gè)較小模型則支持32k的上下文長(zhǎng)度。

Qwen2-阿里云最新發(fā)布的通義千問(wèn)開(kāi)源大模型

3、安全方面:通過(guò)顯著性檢驗(yàn)(P值),Qwen2-72B-Instruct模型在安全性方面與GPT-4的表現(xiàn)相當(dāng),并且顯著優(yōu)于Mistral-8x22B模型。

Qwen2的性能評(píng)測(cè)

相比Qwen1.5,Qwen2在大規(guī)模模型實(shí)現(xiàn)了非常大幅度的效果提升。在針對(duì)預(yù)訓(xùn)練語(yǔ)言模型的評(píng)估中,對(duì)比當(dāng)前最優(yōu)的開(kāi)源模型,Qwen2-72B在包括自然語(yǔ)言理解、知識(shí)、代碼、數(shù)學(xué)及多語(yǔ)言等多項(xiàng)能力上均顯著超越當(dāng)前領(lǐng)先的模型,如Llama-3-70B以及Qwen1.5最大的模型Qwen1.5-110B。

Qwen2-阿里云最新發(fā)布的通義千問(wèn)開(kāi)源大模型

Qwen2-72B-Instruct在提升基礎(chǔ)能力以及對(duì)齊人類價(jià)值觀這兩方面取得了較好的平衡。相比Qwen1.5的72B模型,Qwen2-72B-Instruct在所有評(píng)測(cè)中均大幅超越,并且了取得了匹敵Llama-3-70B-Instruct的表現(xiàn)。

Qwen2-阿里云最新發(fā)布的通義千問(wèn)開(kāi)源大模型

在小模型方面,Qwen2系列模型基本能夠超越同等規(guī)模的最優(yōu)開(kāi)源模型甚至更大規(guī)模的模型。相比近期推出的最好的模型,Qwen2-7B-Instruct依然能在多個(gè)評(píng)測(cè)上取得顯著的優(yōu)勢(shì),尤其是代碼及中文理解上。

Qwen2-阿里云最新發(fā)布的通義千問(wèn)開(kāi)源大模型

如何使用Qwen2?

目前,Qwen2已在Hugging Face和ModelScope上同步開(kāi)源,相關(guān)資源地址如下:

阿里云基于Qwen2的AI編程助手通義靈碼正式上線,如有興趣,可以試試。

?版權(quán)聲明:如無(wú)特殊說(shuō)明,本站所有內(nèi)容均為AIHub.cn原創(chuàng)發(fā)布和所有。任何個(gè)人或組織,在未征得本站同意時(shí),禁止復(fù)制、盜用、采集、發(fā)布本站內(nèi)容到任何網(wǎng)站、書(shū)籍等各類媒體平臺(tái)。否則,我站將依法保留追究相關(guān)法律責(zé)任的權(quán)利。 Trae
0 條回復(fù) A文章作者 M管理員
    暫無(wú)評(píng)論內(nèi)容
error:
主站蜘蛛池模板: 罗江县| 宣汉县| 汝州市| 新安县| 丽江市| 化隆| 陇南市| 蓝山县| 宁波市| 宿迁市| 屏山县| 铜山县| 惠水县| 盘锦市| 延安市| 彰武县| 梁山县| 米脂县| 西城区| 旌德县| 喜德县| 旅游| 珲春市| 砚山县| 保亭| 清水河县| 溧阳市| 安图县| 资溪县| 永福县| 聂拉木县| 临江市| 巴彦淖尔市| 水城县| 丰顺县| 鹿邑县| 成安县| 越西县| 辽阳县| 郁南县| 恭城|