-
Emu3:智源推出的原生多模態(tài)世界模型,可實(shí)現(xiàn)圖像、文本、視頻的統(tǒng)一理解和生成
Emu3是智源研究院發(fā)布的原生多模態(tài)世界模型,該模型只基于下一個(gè) token 預(yù)測(cè),無需擴(kuò)散模型或組合方法,即可完成文本、圖像、視頻三種模態(tài)數(shù)據(jù)的理解和生成- 3.5k
- 0
-
SmolLM-HuggingFace發(fā)布的高性能小型語言模型
SmolLM是由 Huggingface 最新發(fā)布的一組高性能的小型語言模型,參數(shù)分別為 1.35 億、3.6 億和 17 億,訓(xùn)練數(shù)據(jù)來自高質(zhì)量數(shù)據(jù)集 SmolLM-Corpus,其中包括 Cosmopedia v2、Python-Edu 和 FineWeb-Edu。SmolLM 模型在多種基準(zhǔn)測(cè)試中表現(xiàn)不錯(cuò), 適合跑在手機(jī)這種終端設(shè)備上。- 4.9k
- 0
-
神農(nóng)大模型-中國農(nóng)業(yè)大學(xué)發(fā)布的農(nóng)業(yè)AI大模型,覆蓋育種、種植農(nóng)業(yè)遙感及氣象等
神農(nóng)大模型是農(nóng)業(yè)科技領(lǐng)域的AI系統(tǒng),模型具備農(nóng)業(yè)知識(shí)問答、農(nóng)業(yè)文本語義理解、文本摘要生成、農(nóng)業(yè)生產(chǎn)決策推理等多項(xiàng)功能- 9.2k
- 0
-
Step-1V:階躍星辰推出的千億參數(shù)多模態(tài)大模型
Step-1V是階躍星辰研發(fā)的一款千億參數(shù)的多模態(tài)大模型。這個(gè)模型在多個(gè)領(lǐng)域表現(xiàn)出色,特別是在圖像理解、多輪指令跟隨、數(shù)學(xué)能力、邏輯推理和文本創(chuàng)作等方面。- 10.1k
- 0
-
Genie-谷歌發(fā)布的AI基礎(chǔ)世界模型,一張圖片生成交互世界
Genie是由谷歌發(fā)布的根據(jù)互聯(lián)網(wǎng)視頻訓(xùn)練的基礎(chǔ)世界模型,該模型參數(shù)規(guī)模為11B,可以從合成圖像、照片甚至草圖生成無數(shù)種動(dòng)作可控的交互式環(huán)境。- 9.5k
- 0