-
Baichuan-M2:百川智能開源的醫(yī)療增強推理大模型
Baichuan-M2-32B 是百川智能推出的醫(yī)療增強推理模型,專為真實世界的醫(yī)療推理任務(wù)設(shè)計。該模型基于 Qwen2.5-32B 基座,通過創(chuàng)新的大型驗證器系統(tǒng)(Large Verifier System)從真實世界的醫(yī)療問題出發(fā),進行醫(yī)療領(lǐng)域后訓(xùn)練對齊,在保持模型通用能力的同時,實現(xiàn)了醫(yī)療效果的突破性提升。- 230
- 0
-
Skywork UniPic 2.0:昆侖萬維開源的統(tǒng)一多模態(tài)生成與編輯模型
UniPic 2.0 是 Skywork 推出的統(tǒng)一多模態(tài)模型,基于 SD3.5-Medium 的 2B DiT,結(jié)合“在線強化學(xué)習(xí)+雙任務(wù)漸進強化”,在生成與編輯上優(yōu)于同級開源模型,并擴展為理解-生成-編輯一體的統(tǒng)一模型,提供技術(shù)報告、代碼與權(quán)重。- 386
- 0
-
SkyReels-A3:昆侖萬維推出的音頻驅(qū)動人像視頻生成模型
SkyReels-A3是昆侖萬維新發(fā)布的音頻驅(qū)動任意時長人像視頻模型,一句話照片+聲音即可讓靜態(tài)人像開口說話、唱歌或帶貨,支持分鐘級長視頻、8種運鏡控制,效果超越當(dāng)前開源/閉源方案,零門檻在線可用。- 1.1k
- 0
-
GPT-OSS:OpenAI開源的大語言模型,支持本地部署與高效推理
GPT-OSS是 OpenAI 發(fā)布的開源權(quán)重大語言模型系列,包含 20B 與 120B 兩個版本,支持原生 128K tokens 長上下文、MoE 架構(gòu)高效推理、微調(diào)與智能體功能,適合本地部署與企業(yè)級生成式應(yīng)用,采用 Apache 2.0 許可協(xié)議。- 1.5k
- 0
-
Step 3:階躍星辰開源的多模態(tài)推理模型
Step 3 是階躍星辰團隊最新推出并開源的多模態(tài)推理模型,采用 MoE 架構(gòu),總參數(shù)量 321B,激活參數(shù)量 38B,上下文長度64k,擁有強大的視覺感知和復(fù)雜推理能力,可準(zhǔn)確完成跨領(lǐng)域的復(fù)雜知識理解、數(shù)學(xué)與視覺信息的交叉分析,以及日常生活中的各類視覺分析問題。- 2.2k
- 0
-
Wan2.2 - 阿里通義開源的視頻和圖像生成模型
Wan2.2 是由阿里通義大模型團隊發(fā)布的開源視頻生成模型,專為電影級視覺控制和高質(zhì)量視頻創(chuàng)作設(shè)計。它通過混合專家(MoE)架構(gòu),實現(xiàn)了對電影鏡頭語言的深度理解和還原,支持多維度的視覺呈現(xiàn),如光影、色彩和構(gòu)圖。- 2.6k
- 0
-
GLM-4.5:智譜AI推出的新一代開源旗艦AI模型
GLM-4.5 是由智譜 AI 推出的開源 SOTA 模型,專為智能體應(yīng)用打造,具備卓越的推理、代碼生成和智能體能力。采用混合專家架構(gòu),提供思考模式和非思考模式,滿足復(fù)雜任務(wù)和即時響應(yīng)需求。- 2.7k
- 0
-
Qwen VLo - 阿里推出的多模態(tài)統(tǒng)一理解與生成模型
Qwen VLo 是通義千問團隊推出的多模態(tài)統(tǒng)一理解與生成模型,具備強大的圖文雙向交互能力。它不僅能精準(zhǔn)理解圖像內(nèi)容,還能根據(jù)自然語言指令進行高質(zhì)量的圖像生成與編輯,支持風(fēng)格遷移、背景更換、物體添加等多種操作- 2.2k
- 0
-
FLUX.1 Kontext [dev]:Black Forest Labs開源的圖像編輯模型
FLUX.1 Kontext \[dev] 是 Black Forest Labs 推出的開源圖像編輯模型,支持通過自然語言對圖像進行局部修改,具備風(fēng)格與角色一致性保持、多輪穩(wěn)定編輯等能力。該模型基于 Flow Transformer 架構(gòu),編輯精度高、響應(yīng)速度快,適合創(chuàng)作者、開發(fā)者和研究人員用于插畫創(chuàng)作、視覺敘事和圖像生成研究。- 3.3k
- 0
-
Step1X-3D:階躍星辰開源的3D大模型,支持生成高保真可控的3D內(nèi)容
Step1X-3D 是由階躍星辰正式發(fā)布并開源的一款3D大模型。該模型是繼圖像、視頻、語音、音樂等模態(tài)后,階躍星辰在多模態(tài)AI方向的最新成果,專注于生成高保真、可控的3D內(nèi)容。- 1.5k
- 0
-
Seed1.5-VL:字節(jié)跳動推出的視覺-語言多模態(tài)基礎(chǔ)模型
Seed1.5-VL 是字節(jié)跳動推出的視覺-語言多模態(tài)基礎(chǔ)模型,結(jié)合圖像編碼器與200億激活參數(shù)的大語言模型,具備出色的圖像、視頻理解與推理能力。在60項基準(zhǔn)測試中獲得38項SOTA,廣泛應(yīng)用于視頻問答、圖表理解、GUI智能體等任務(wù),表現(xiàn)穩(wěn)定、推理強大。- 1.1k
- 0
-
Matrix-Game:昆侖萬維開源的交互式世界基礎(chǔ)模型
Matrix-Game是由昆侖萬維開源的交互式世界基礎(chǔ)模型,能夠生成完整可交互的游戲世界,能夠?qū)θ祟愝斎氲牟僮髦噶钸M行正確響應(yīng),保留了游戲世界的空間結(jié)構(gòu)與物理特性,畫面也更加精致,超越了以往所有類似開源世界模型。- 1.4k
- 0
-
Seed-Coder:字節(jié)跳動最新推出的開源代碼模型
Seed-Coder 是字節(jié)跳動開源的 8B(80億參數(shù))級代碼大模型,它包括 Base、Instruct 和 Reasoning 三個版本,具備強大的代碼生成、理解和推理能力。其最大亮點是采用“模型自助式”數(shù)據(jù)管道,利用大模型自動篩選和構(gòu)建高質(zhì)量訓(xùn)練數(shù)據(jù),減少人工規(guī)則依賴。- 1.6k
- 0
-
HunyuanCustom:騰訊混元開源的多模態(tài)定制化視頻生成工具
HunyuanCustom是騰訊混元推出的一款多模態(tài)定制化視頻生成工具,它基于混元視頻生成大模型(HunyuanVideo)打造,融合了文本、圖像、音頻、視頻等多模態(tài)輸入,能夠生成高質(zhì)量的定制化視頻。該工具在主體一致性效果上超越了現(xiàn)有的開源方案,具備高度控制力和生成質(zhì)量。- 3.1k
- 0
-
DeepSeek-Prover-V2:DeepSeek最新開源的數(shù)學(xué)定理證明模型,參數(shù)量高達6710億
DeepSeek-Prover-V2 是由 DeepSeek 最新開源的超大規(guī)模數(shù)學(xué)定理證明模型,參數(shù)量高達 6710 億(671B),相比前代 Prover-V1.5(約 7B)提升近百倍,成為目前開源中最大規(guī)模的數(shù)學(xué)推理模型之一。該模型專為形式化數(shù)學(xué)證明設(shè)計,能夠生成兼容 Lean 4 等主流證明助手的高質(zhì)量證明步驟,支持復(fù)雜邏輯驗證、定理發(fā)現(xiàn)與教學(xué)應(yīng)用。- 4.1k
- 0
-
Kimi-Audio:Kimi開源的通用音頻基礎(chǔ)模型,支持語音識別、音頻理解等多種任務(wù)
Kimi-Audio是kimi開源的全新通用音頻基礎(chǔ)模型,支持語音識別、音頻理解、音頻轉(zhuǎn)文本、語音對話等多種任務(wù),在十多個音頻基準(zhǔn)測試中實現(xiàn)了最先進的 (SOTA) 性能。- 2.6k
- 0
-
Gemini 2.5 Flash:Google 推出的首個完全混合推理模型
Gemini 2.5 Flash 是 Google 推出的首個完全混合推理模型,允許開發(fā)人員靈活控制模型的思考功能,可開啟或關(guān)閉。它還支持設(shè)置思考預(yù)算,幫助開發(fā)者在質(zhì)量、成本和延遲之間找到最佳平衡。即使關(guān)閉思考功能,模型仍能保持 2.0 Flash 的高速度,并進一步提升性能,兼具高效推理和成本效益。目前處于預(yù)覽階段,支持通過 API 在 Google AI Studio 和 Vertex AI …- 3.2k
- 0
-
豆包1.5·深度思考模型:火山引擎推出的AI推理模型
在數(shù)學(xué)、編程、科學(xué)推理等專業(yè)領(lǐng)域及創(chuàng)意寫作等通用任務(wù)中表現(xiàn)突出,在AIME 2024、Codeforces、GPQA等多項權(quán)威基準(zhǔn)上達到或接近業(yè)界第一梯隊水平。支持128k上下文窗口,16k輸出。- 3.6k
- 0
-
減單 - 安徽醫(yī)科大學(xué)等推出的體重管理大模型智能助手
“減單”是由安徽醫(yī)科大學(xué)聯(lián)合中國科學(xué)技術(shù)大學(xué)附屬第一醫(yī)院和健康科技企業(yè)共同發(fā)布的體重管理大模型智能助手。它基于國內(nèi)外多個AI大模型技術(shù),結(jié)合超過40萬名肥胖相關(guān)慢性疾病患者的管理數(shù)據(jù)訓(xùn)練而成,旨在借助AI技術(shù)提高減重的個性化干預(yù)質(zhì)量和診療效率。- 3.2k
- 0
-
Skywork R1V:昆侖萬維開源的多模態(tài)視覺思維鏈推理模型
Skywork R1V 是昆侖萬維開源的多模態(tài)視覺思維鏈推理模型,專注于通過多步邏輯推理解決復(fù)雜的視覺任務(wù)。它結(jié)合了強大的文本推理能力和視覺理解能力,能夠處理視覺邏輯推理、數(shù)學(xué)問題、科學(xué)現(xiàn)象分析等任務(wù)。- 1.5k
- 0
-
Gemma 3:Google 推出的輕量級高性能開源模型,支持單個GPU運行
Gemma 3 是 Google 推出的輕量級、高性能開源模型,支持多種尺寸(1B、4B、12B 和 27B),專為單 GPU 或 TPU 設(shè)計。它支持 140 多種語言,具備高級文本和視覺推理能力,配備 128k-token 上下文窗口和函數(shù)調(diào)用功能,支持復(fù)雜任務(wù)處理。Gemma 3 提供量化版本,優(yōu)化性能,降低計算需求,并配備安全特性。它無縫集成多種開發(fā)工具,支持靈活部署,助力開發(fā)者快速構(gòu)建高…- 7.9k
- 0
-
QwQ-32B:阿里云開源的最新AI推理模型,更小尺寸,消費級顯卡即可部署
QwQ-32B 是阿里云開源的320億參數(shù)推理模型,具備強大的數(shù)學(xué)、代碼和通用推理能力,性能比肩全球頂尖開源模型。它支持消費級顯卡部署,降低硬件門檻,同時集成智能體能力,可靈活調(diào)整推理過程。采用Apache 2.0協(xié)議開源,用戶可免費下載、商用和定制化開發(fā),推動AI技術(shù)的廣泛應(yīng)用。- 10.2k
- 0
-
SpeciesNet - 谷歌開源的AI模型,助力野生動物識別和保護
SpeciesNet是谷歌開源的一款A(yù)I模型,專為識別野生動物而設(shè)計。它通過分析相機陷阱拍攝的照片,能夠?qū)D像分類為超過2000個標(biāo)簽,涵蓋動物物種、分類群和非動物對象。模型基于6500萬張圖像訓(xùn)練,具備高準(zhǔn)確性和廣泛適用性,采用Apache 2.0開源許可,助力生物多樣性研究和保護。- 2.5k
- 0
-
企業(yè)微信接入DeepSeek,開啟智能化辦公新紀(jì)元
2025年2月21日,企業(yè)微信宣布正式接入DeepSeek R1,并同步支持騰訊混元大模型。此次更新帶來了多項基于AI的功能升級,包括“智能機器人”和“智能表格-客戶跟進總結(jié)”,旨在大幅提升企業(yè)內(nèi)部協(xié)作和客戶服務(wù)的效率。- 1.9k
- 0