-
Stable Diffusion-全球最強開源AI繪畫模型
Stable Diffusion 完全免費開源,所有代碼均在 GitHub 上公開,任何人都可以拷貝使用,只需要輸入一句提示詞(prompt),就能夠在幾秒鐘內創造出令人驚嘆的繪畫作品。 -
藍心大模型BlueLM
BlueLM是vivo開發的一款強大的語言理解模型,它具有豐富的場景應用能力。這個模型以其龐大的規模、先進的算法、安全性和自我進化的特點,標志著人工智能新時代的到來。BlueLM擁有70億的模型參數量和2.6T的多語言語料,能夠處理32K的大尺寸上下文,這使得它在處理復雜的語言理解任務時表現出色。 -
Vidu:生數科技發布的AI視頻生成工具,可生成16秒1080P高清視頻
Vidu支持文生視頻、圖生視頻及角色一致性生成功能,語義理解精準、鏡頭語言豐富、動態感強,具備寫實和動漫等多元風格,讓視頻創作釋放無限可能 -
DeepSeek-R1:深度求索發布的AI推理模型,性能對標 OpenAI o1 正式版
DeepSeek-R1 是深度求索推出的高性能推理模型,性能與 OpenAI o1 正式版相當。通過強化學習技術和極少標注數據,DeepSeek-R1 在數學、代碼和自然語言推理等任務中表現卓越。該模型遵循 MIT License 開源,支持模型蒸餾,允許用戶訓練其他模型。此外,DeepSeek-R1 提供 API 服務,按 token 計費,廣泛應用于科研、技術開發和企業智能化升級等領域。 -
Grok 3:馬斯克旗下XAI發布的新一代AI大模型
Grok 3是由埃隆·馬斯克旗下公司xAI開發的的新一代大語言模型系列,包括Grok-3及其精簡版Grok-3 mini。Grok 3計算能力是前代的十倍,具備思維鏈推理和邏輯一致性。數學、科學推理和編程能力領先,AIME'24得52分,科學知識75分,編程57分,AIME 2025得93分,LMSYS聊機競技場得1400分。新增Big Brain和DeepSearch模式,優化復雜任務… -
DeepSeek-V3:DeepSeek推出的開源自研 MoE 模型,性能與速度全面突破
DeepSeek-V3 是由深度求索公司推出的一款全新發布的自研 MoE(混合專家)模型,旨在突破當前大語言模型的性能瓶頸。通過 671B 參數和 37B 激活專家,DeepSeek-V3 在 14.8T token 的大規模預訓練上取得了顯著進展,展現出與世界頂尖閉源模型(如 GPT-4o 和 Claude-3.5-Sonnet)相當的表現。該模型在多項標準評測中超越了 Qwen2.5-72B … -
天工SkyMusic-昆侖萬維推出的AI音樂生成大模型
「天工SkyMusic」是昆侖萬維推出的AI音樂生成大模型,基于昆侖萬維「天工3.0」超級大模型打造,是目前國內唯一公開可用的AI音樂生成大模型。具備高質量音樂制作、逼真人聲合成、精準歌詞控制、多元風格適應及復雜歌唱技巧學習等五大特點。該模型基于先進的Transformer技術,能夠根據用戶輸入生成具有豐富情感表達的音樂作品,旨在推動音樂創作的創新和個性化發展。 -
-
豆包大模型1.5:字節跳動推出的新一代多模態AI大模型
豆包大模型1.5是字節跳動推出的新一代多模態AI大模型,涵蓋多個版本,包括Doubao-1.5-pro、Doubao-1.5-lite、Doubao-1.5-vision-pro和實時語音模型。該模型在知識、代碼、推理、中文等多個權威測評中表現優異,性能全球領先,適用于教育、開發和商業等多個領域。豆包大模型1.5采用稀疏MoE架構,優化推理效率,支持多模態和語音交互,推動AI技術創新與應用。 -
Gemini-谷歌發布的多模態AI大模型
AIHub 12 月 6 日消息,谷歌宣布推出其認為規模最大、功能最強大的人工智能多模態AI模型 Gemini。意味著它可以理解、操作和結合不同類型的信息,包括文本、代碼、音頻、圖像和視頻。 -
K1.5:Kimi 最新推出的多模態思考模型
Kimi k1.5 是Kimi推出的最新多模態思考模型,專為解決復雜的推理任務而設計。作為一款集數學推理、代碼生成、視覺推理和多模態數據分析于一體的高性能AI模型,k1.5在推理速度和準確性上取得了突破性進展,標志著AI推理技術的進一步提升。 -
Janus-Pro:DeepSeek推出的開源AI模型,支持圖像理解和圖像生成
Janus-Pro是由DeepSeek推出的開源大一統模型,支持圖像理解和圖像生成,提供 1B 和 7B 兩種規模,適配多元應用場景。它通過改進的訓練策略、擴展的數據集和更大規模的模型,顯著提升了文本到圖像的生成能力和指令跟隨性能。 -
EMO-阿里巴巴發布的AI肖像視頻生成框架
EMO是一個由阿里巴巴發布的音頻驅動的肖像視頻生成框架。它能夠通過單一參考圖像和音頻輸入,生成具有豐富表情和多樣頭部姿勢的虛擬角色視頻。EMO利用先進的注意力機制和去噪網絡,支持多語言和多種肖像風格的動態表現,為內容創作和虛擬角色動畫制作提供了新工具。 -
-
訊飛星火認知大模型
訊飛星火是科大訊飛發布的認知大模型,以中文為核心的新一代認知智能大模型,擁有跨領域的知識和語言理解能力,能夠基于自然對話方式理解與執行任務。從海量數據和大規模知識中持續進化,實現從提出、規劃到解決問題的全流程閉環。 -
Llama 3-Meta最新推出的新一代開源大模型
Llama 3是一款由Meta推出的大型開源人工智能語言模型,Llama-3共有80億、700億兩個參數版本,與Llama-2相比,Llama-3使用了15T tokens的訓練數據,在推理、數學、代碼生成、指令跟蹤等能力獲得大幅度提升。 -
MiniMax-01:MiniMax推出的開源AI模型,400萬超長上下文,性能比肩GPT-4o
MiniMax-01是一個先進的大型語言模型系列,包括MiniMax-Text-01和MiniMax-VL-01。這些模型通過閃電注意力機制和混合專家架構,能夠高效處理長達400萬個token的上下文窗口,在多個標準和內部基準測試中表現出色,特別是在長上下文處理方面顯著優于其他頂級模型。 -
VideoWorld:豆包等推出的開源視頻生成模型,從無標簽視頻中學習知識
VideoWorld是豆包大模型團隊聯合北京交通大學、中國科學技術大學共同開發的視頻生成實驗模型,通過無標注的視頻數據訓練,探索AI如何從視覺輸入中學習復雜任務。 -
-
-
華知大模型-同方知網攜手華為推出的中華知識大模型
華知大模型是同方知網攜手華為共同打造內容權威可信、全棧自主可控的專注于知識服務與科研行業的中華知識大模型,旨在覆蓋政企文教等多個行業場景,并提供30多項通用能力體系。 -
-
Qwen2.5-Max:阿里通義千問推出的旗艦MoE模型
Qwen2.5-Max是阿里云推出的超大規模MoE模型,采用超過20萬億tokens的預訓練數據,展現卓越性能。該模型在多個基準測試中超越DeepSeek V3、GPT-4o等領先AI,支持指令模型和基座模型。用戶可通過Qwen Chat平臺直接對話或調用API進行集成。 -
Genesis:生成式物理引擎,一句話生成完整精確的模擬物理世界
Genesis 是一款由國內外眾多高校和產業機構聯合開發的生成式物理引擎,專為通用機器人/嵌入式 AI/物理 AI?應用程序而設計。結合 AI 與物理仿真技術,實現超高精度的動態模擬與多模態生成。 -
DCLM-7B:蘋果最新推出的開源AI語言模型
DCLM-7B是蘋果與合作伙伴一起推出的開源小型語言模型,全部開源,包括權重、訓練代碼和數據集。DCLM-7B性能優異,接近大型模型,采用decoder-only架構,上下文長度2048。DCLM在多個基準任務上性能出色,支持商業使用。 -
TripoSR - 單張圖片快速生成高質量3D模型
TripoSR是由Stability AI 和國內AI企業VAST合作開源的快速3D物體重建模型,能在1秒內從單張2D圖像快速生成高質量的3D模型。 -
-
阿里達摩院遙感 AI 大模型
阿里達摩院發布業內首個遙感 AI 大模型(AIE-SEG),號稱“率先在遙感領域實現了圖像分割的任務統一”、“一個模型實現‘萬物零樣本’的快速提取”,并可識別農田、水域、建筑物等近百種遙感地物分類,還能根據用戶的交互式反饋自動調優識別結果。 -
混元3D 2.0:騰訊混元發布的3D開源模型2.0版本
混元3D 2.0是騰訊混元推出的3D開源大模型2.0版本,旨在通過先進的AI技術,快速生成高質量的3D模型。對比1.0版本,2.0版本也依然同時支持文、圖生3D的能力,并在生成效果上得到顯著提升,在幾何結構上更加精細,紋理色彩更加豐富,支持更精細、更逼真的3D內容創作。 -
HiDream.ai:AI視頻和圖像生成平臺
HiDream AI是一個提供多種圖像和視頻生成服務的AIGC創作平臺和社區,由前京東副總裁、加拿大工程院外籍院士梅濤于2023年3月成立。HiDream AI主要包括文生圖、圖生圖、文生視頻、圖生視頻、圖片智能重繪、智能拓圖、智能排版、視頻智能編輯、設計師展示交流社區、AI創意創作大賽、AIGC課程及攻略等欄目,幫助您零基礎輕松掌握AIGC一站式能力,喚醒創造力、生命感和價值感,解放生產力,全面… -
Goku:港大字節推出的AI視頻生成模型
Goku是香港大學與字節跳動合作開發的視頻生成模型,基于Rectified Flow Transformer架構,能夠從文本、圖像或圖文輸入生成高質量的視頻。 -
豆包大模型-字節跳動推出的系列大語言模型
豆包大模型是字節跳動自研的一系列人工智能模型,包括通用模型Pro、Lite、角色扮演模型、語音合成模型、聲音復刻模型、語音識別模型、文生圖模型、Function Call模型和向量化模型。這些模型支持長文本處理、個性化角色創作、語音合成與識別、聲音克隆、圖文創作、復雜工具調用等功能,適用于問答、創作、分類等多種場景。 -
Llama 3.1:Meta最新推出的開源大語言模型
Llama 3.1是Meta最新推出的開源大語言模型,有三種規格:80億、700億和4050億參數,支持八種語言,具備128K擴展上下文長度。它提供卓越的通用知識、數學計算、多語言翻譯和工具使用能力,開放下載并允許開發者定制和微調。 -
-
GLM-Realtime:智譜最新推出的端到端AI模型,支持2分鐘記憶和清唱功能
GLM-Realtime是由智譜推出的低延遲端到端多模態模型,具備視頻理解、語音交互、內容記憶、清唱功能和 Function Call 功能。它適用于多種實時交互場景,通過 Function Call 功能可以拓展到更廣泛的商業應用。開發者可以免費調用該模型,體驗其強大的實時交互能力。 -
DeepSeek-V2.5:深度求索推出的融合通用與代碼能力的開源模型
DeepSeek-V2.5是由杭州深度求索推出的融合了通用對話能力和強大代碼處理能力的開源AI模型。它結合了DeepSeek-Chat和DeepSeek-Coder模型,支持通用任務和代碼生成,同時優化了用戶體驗。 -
-
-
-
DeepSeek-R1-Lite預覽版模型:深度求索推出的新一代AI推理模型
DeepSeek-R1-Lite 預覽版模型是由 DeepSeek 推出的新一代推理模型,采用強化學習訓練,具備長思維鏈推理能力,適用于數學、編程和復雜邏輯推理。模型在數學競賽和編程任務中表現卓越,超越 GPT-4o 等知名模型。用戶可通過網頁版在“深度思考”模式中體驗全面、嚴謹的推理過程,未來正式版將開源并提供 API 支持,進一步釋放模型潛力。