-
Emu3:智源推出的原生多模態世界模型,可實現圖像、文本、視頻的統一理解和生成
Emu3是智源研究院發布的原生多模態世界模型,該模型只基于下一個 token 預測,無需擴散模型或組合方法,即可完成文本、圖像、視頻三種模態數據的理解和生成- 2.4k
- 0
-
SmolLM-HuggingFace發布的高性能小型語言模型
SmolLM是由 Huggingface 最新發布的一組高性能的小型語言模型,參數分別為 1.35 億、3.6 億和 17 億,訓練數據來自高質量數據集 SmolLM-Corpus,其中包括 Cosmopedia v2、Python-Edu 和 FineWeb-Edu。SmolLM 模型在多種基準測試中表現不錯, 適合跑在手機這種終端設備上。- 3.8k
- 0
-
神農大模型-中國農業大學發布的農業AI大模型,覆蓋育種、種植農業遙感及氣象等
神農大模型是農業科技領域的AI系統,模型具備農業知識問答、農業文本語義理解、文本摘要生成、農業生產決策推理等多項功能- 6.8k
- 0
-
Step-1V:階躍星辰推出的千億參數多模態大模型
Step-1V是階躍星辰研發的一款千億參數的多模態大模型。這個模型在多個領域表現出色,特別是在圖像理解、多輪指令跟隨、數學能力、邏輯推理和文本創作等方面。- 8.6k
- 0
-
Genie-谷歌發布的AI基礎世界模型,一張圖片生成交互世界
Genie是由谷歌發布的根據互聯網視頻訓練的基礎世界模型,該模型參數規模為11B,可以從合成圖像、照片甚至草圖生成無數種動作可控的交互式環境。- 7.3k
- 0