-
Llama 3.2:Meta最新推出的開源模型,包括視覺大語言模型和設備端純文本模型
Llama 3.1是Meta最新推出的開源大語言模型,包括90B和11B兩種參數規格的視覺大語言模型,還有能在設備端本地運行的1B和3B輕量級純文本模型,包括預訓練和指令調整版。1B和3B模型支持128K tokens上下文,適配高通和聯發科硬件,并針對Arm處理器做了優化。- 9.6k
- 0
-
CogVideoX-智譜推出的開源AI視頻生成模型
CogVideoX是由智譜AI開發的視頻生成大模型,具備強大的視頻生成能力、只需輸入文本或圖片就可以輕松完成視頻制作。此次開源的是CogVideoX-2B,20億參數規格的模型,是CogVideoX 系列視頻生成模型中的第一個模型,與智譜推出的AI視頻生成產品清影同源。- 5k
- 0
-
Mistral Large 2:Mistral AI發布的新一代 AI 大模型
Mistral Large 2 是法國AI公司 Mistral AI 發布的新一代 AI 大語言模型, Mistral Large 2 有 1230 億個參數和 128k 的上下文窗口,支持法語、德語、西班牙語、意大利語、中文等多語言能力,覆蓋 80 多種編程語言。該模型展示了改進的推理和準確性,在 MMLU 基準測試中達到了 84%,并與 GPT-4o、Claude 3 Opus 和 Llama…- 3.2k
- 0
-
Llama 3.1:Meta最新推出的開源大語言模型
Llama 3.1是Meta最新推出的開源大語言模型,有三種規格:80億、700億和4050億參數,支持八種語言,具備128K擴展上下文長度。它提供卓越的通用知識、數學計算、多語言翻譯和工具使用能力,開放下載并允許開發者定制和微調。- 15.2k
- 0
-
Mistral NeMo:Mistral AI和英偉達聯合發布的AI小模型
Mistral NeMo是由法國AI公司Mistral AI與NVIDIA合作開發的一個120億(12B)參數的大型語言模型。它提供高達128k tokens的上下文窗口,并且在推理、世界知識和編碼準確性方面達到了該規模模型的先進水平。- 3.1k
- 0
-
DCLM-7B:蘋果最新推出的開源AI語言模型
DCLM-7B是蘋果與合作伙伴一起推出的開源小型語言模型,全部開源,包括權重、訓練代碼和數據集。DCLM-7B性能優異,接近大型模型,采用decoder-only架構,上下文長度2048。DCLM在多個基準任務上性能出色,支持商業使用。- 17.3k
- 0