-
Qwen2-阿里云最新發(fā)布的通義千問(wèn)開源大模型
Qwen2是阿里云通義千問(wèn)團(tuán)隊(duì)開源的新一代大語(yǔ)言模型,推出了5個(gè)尺寸的預(yù)訓(xùn)練和指令微調(diào)模型,在中文英語(yǔ)的基礎(chǔ)上,訓(xùn)練數(shù)據(jù)中增加了27種語(yǔ)言相關(guān)的高質(zhì)量數(shù)據(jù);代碼和數(shù)學(xué)能力顯著提升;增大了上下文長(zhǎng)度支持,最高達(dá)到128K?tokens(Qwen2-72B-Instruct)。多個(gè)評(píng)測(cè)基準(zhǔn)上的領(lǐng)先表現(xiàn)。現(xiàn)已在Hugging Face和ModelScope開源。- 10.6k
- 0
-
Llama中文社區(qū)
Llama中文社區(qū)是中國(guó)最大的開源技術(shù)社區(qū),開放了一系列尺寸的大模型。基于當(dāng)前最優(yōu)秀的開源模型Llama2,使用主流Decoder-only的標(biāo)準(zhǔn)Transformer網(wǎng)絡(luò)結(jié)構(gòu),支持32K的上下文長(zhǎng)度(Context Length),為同尺寸模型中最長(zhǎng),能滿足更長(zhǎng)的多輪對(duì)話、知識(shí)問(wèn)答與摘要等需求,模型應(yīng)用場(chǎng)景更廣泛。- 4.1k
- 0
-
-
Yi大模型-零一萬(wàn)物發(fā)布的開源大模型
Yi系列模型是由來(lái)自“零一萬(wàn)物”的開發(fā)者研發(fā)的大型語(yǔ)言模型。第一個(gè)公開版本包含兩個(gè)雙語(yǔ)版(英語(yǔ)/中文)基礎(chǔ)模型,參數(shù)規(guī)模分別為6B和34B。兩者都使用4K序列長(zhǎng)度進(jìn)行訓(xùn)練,并在推理時(shí)可以擴(kuò)展到32K。- 12.9k
- 0