全部標(biāo)簽

AI大模型

Baichuan-M2：百川智能開源的醫(yī)療增強推理大模型

Baichuan-M2-32B 是百川智能推出的醫(yī)療增強推理模型，專為真實世界的醫(yī)療推理任務(wù)設(shè)計。該模型基于 Qwen2.5-32B 基座，通過創(chuàng)新的大型驗證器系統(tǒng)（Large Verifier System）從真實世界的醫(yī)療問題出發(fā)，進行醫(yī)療領(lǐng)域后訓(xùn)練對齊，在保持模型通用能力的同時，實現(xiàn)了醫(yī)療效果的突破性提升。
AI模型
- 230
- 0
AIHub8月13日
Skywork UniPic 2.0：昆侖萬維開源的統(tǒng)一多模態(tài)生成與編輯模型

UniPic 2.0 是 Skywork 推出的統(tǒng)一多模態(tài)模型，基于 SD3.5-Medium 的 2B DiT，結(jié)合“在線強化學(xué)習(xí)+雙任務(wù)漸進強化”，在生成與編輯上優(yōu)于同級開源模型，并擴展為理解-生成-編輯一體的統(tǒng)一模型，提供技術(shù)報告、代碼與權(quán)重。
AI模型
- 386
- 0
AIHub8月13日
SkyReels-A3：昆侖萬維推出的音頻驅(qū)動人像視頻生成模型

SkyReels-A3是昆侖萬維新發(fā)布的音頻驅(qū)動任意時長人像視頻模型，一句話照片+聲音即可讓靜態(tài)人像開口說話、唱歌或帶貨，支持分鐘級長視頻、8種運鏡控制，效果超越當(dāng)前開源/閉源方案，零門檻在線可用。
AI模型
- 1.1k
- 0
AIHub8月12日
GPT-OSS：OpenAI開源的大語言模型，支持本地部署與高效推理

GPT-OSS是 OpenAI 發(fā)布的開源權(quán)重大語言模型系列，包含 20B 與 120B 兩個版本，支持原生 128K tokens 長上下文、MoE 架構(gòu)高效推理、微調(diào)與智能體功能，適合本地部署與企業(yè)級生成式應(yīng)用，采用 Apache 2.0 許可協(xié)議。
AI模型
- 1.5k
- 0
AIHub8月6日
Step 3：階躍星辰開源的多模態(tài)推理模型

Step 3 是階躍星辰團隊最新推出并開源的多模態(tài)推理模型，采用 MoE 架構(gòu)，總參數(shù)量 321B，激活參數(shù)量 38B，上下文長度64k，擁有強大的視覺感知和復(fù)雜推理能力，可準(zhǔn)確完成跨領(lǐng)域的復(fù)雜知識理解、數(shù)學(xué)與視覺信息的交叉分析，以及日常生活中的各類視覺分析問題。
AI模型
- 2.2k
- 0
AIHub8月1日
Wan2.2 - 阿里通義開源的視頻和圖像生成模型

Wan2.2 是由阿里通義大模型團隊發(fā)布的開源視頻生成模型，專為電影級視覺控制和高質(zhì)量視頻創(chuàng)作設(shè)計。它通過混合專家（MoE）架構(gòu)，實現(xiàn)了對電影鏡頭語言的深度理解和還原，支持多維度的視覺呈現(xiàn)，如光影、色彩和構(gòu)圖。
AI模型
- 2.6k
- 0
AIHub7月29日
GLM-4.5：智譜AI推出的新一代開源旗艦AI模型

GLM-4.5 是由智譜 AI 推出的開源 SOTA 模型，專為智能體應(yīng)用打造，具備卓越的推理、代碼生成和智能體能力。采用混合專家架構(gòu)，提供思考模式和非思考模式，滿足復(fù)雜任務(wù)和即時響應(yīng)需求。
AI模型
- 2.7k
- 0
AIHub7月29日
Qwen VLo - 阿里推出的多模態(tài)統(tǒng)一理解與生成模型

Qwen VLo 是通義千問團隊推出的多模態(tài)統(tǒng)一理解與生成模型，具備強大的圖文雙向交互能力。它不僅能精準(zhǔn)理解圖像內(nèi)容，還能根據(jù)自然語言指令進行高質(zhì)量的圖像生成與編輯，支持風(fēng)格遷移、背景更換、物體添加等多種操作
AI模型
- 2.2k
- 0
AIHub6月28日
FLUX.1 Kontext [dev]：Black Forest Labs開源的圖像編輯模型

FLUX.1 Kontext \[dev] 是 Black Forest Labs 推出的開源圖像編輯模型，支持通過自然語言對圖像進行局部修改，具備風(fēng)格與角色一致性保持、多輪穩(wěn)定編輯等能力。該模型基于 Flow Transformer 架構(gòu)，編輯精度高、響應(yīng)速度快，適合創(chuàng)作者、開發(fā)者和研究人員用于插畫創(chuàng)作、視覺敘事和圖像生成研究。
AI模型
- 3.3k
- 0
AIHub6月27日
Step1X-3D：階躍星辰開源的3D大模型，支持生成高保真可控的3D內(nèi)容

Step1X-3D 是由階躍星辰正式發(fā)布并開源的一款3D大模型。該模型是繼圖像、視頻、語音、音樂等模態(tài)后，階躍星辰在多模態(tài)AI方向的最新成果，專注于生成高保真、可控的3D內(nèi)容。
AI模型
- 1.5k
- 0
AIHub5月14日
Seed1.5-VL：字節(jié)跳動推出的視覺-語言多模態(tài)基礎(chǔ)模型

Seed1.5-VL 是字節(jié)跳動推出的視覺-語言多模態(tài)基礎(chǔ)模型，結(jié)合圖像編碼器與200億激活參數(shù)的大語言模型，具備出色的圖像、視頻理解與推理能力。在60項基準(zhǔn)測試中獲得38項SOTA，廣泛應(yīng)用于視頻問答、圖表理解、GUI智能體等任務(wù)，表現(xiàn)穩(wěn)定、推理強大。
AI模型
- 1.1k
- 0
AIHub5月14日
Matrix-Game：昆侖萬維開源的交互式世界基礎(chǔ)模型

Matrix-Game是由昆侖萬維開源的交互式世界基礎(chǔ)模型，能夠生成完整可交互的游戲世界，能夠?qū)θ祟愝斎氲牟僮髦噶钸M行正確響應(yīng)，保留了游戲世界的空間結(jié)構(gòu)與物理特性，畫面也更加精致，超越了以往所有類似開源世界模型。
AI模型
- 1.4k
- 0
AIHub5月13日
Seed-Coder：字節(jié)跳動最新推出的開源代碼模型

Seed-Coder 是字節(jié)跳動開源的 8B（80億參數(shù)）級代碼大模型，它包括 Base、Instruct 和 Reasoning 三個版本，具備強大的代碼生成、理解和推理能力。其最大亮點是采用“模型自助式”數(shù)據(jù)管道，利用大模型自動篩選和構(gòu)建高質(zhì)量訓(xùn)練數(shù)據(jù)，減少人工規(guī)則依賴。
AI模型
- 1.6k
- 0
AIHub5月12日
HunyuanCustom：騰訊混元開源的多模態(tài)定制化視頻生成工具

HunyuanCustom是騰訊混元推出的一款多模態(tài)定制化視頻生成工具，它基于混元視頻生成大模型（HunyuanVideo）打造，融合了文本、圖像、音頻、視頻等多模態(tài)輸入，能夠生成高質(zhì)量的定制化視頻。該工具在主體一致性效果上超越了現(xiàn)有的開源方案，具備高度控制力和生成質(zhì)量。
AI模型
- 3.1k
- 0
AIHub5月11日
DeepSeek-Prover-V2：DeepSeek最新開源的數(shù)學(xué)定理證明模型，參數(shù)量高達6710億

DeepSeek-Prover-V2 是由 DeepSeek 最新開源的超大規(guī)模數(shù)學(xué)定理證明模型，參數(shù)量高達 6710 億（671B），相比前代 Prover-V1.5（約 7B）提升近百倍，成為目前開源中最大規(guī)模的數(shù)學(xué)推理模型之一。該模型專為形式化數(shù)學(xué)證明設(shè)計，能夠生成兼容 Lean 4 等主流證明助手的高質(zhì)量證明步驟，支持復(fù)雜邏輯驗證、定理發(fā)現(xiàn)與教學(xué)應(yīng)用。
AI模型
- 4.1k
- 0
AIHub4月30日
Kimi-Audio：Kimi開源的通用音頻基礎(chǔ)模型，支持語音識別、音頻理解等多種任務(wù)

Kimi-Audio是kimi開源的全新通用音頻基礎(chǔ)模型，支持語音識別、音頻理解、音頻轉(zhuǎn)文本、語音對話等多種任務(wù)，在十多個音頻基準(zhǔn)測試中實現(xiàn)了最先進的 (SOTA) 性能。
AI模型
- 2.6k
- 0
AIHub4月27日
Gemini 2.5 Flash：Google 推出的首個完全混合推理模型

Gemini 2.5 Flash 是 Google 推出的首個完全混合推理模型，允許開發(fā)人員靈活控制模型的思考功能，可開啟或關(guān)閉。它還支持設(shè)置思考預(yù)算，幫助開發(fā)者在質(zhì)量、成本和延遲之間找到最佳平衡。即使關(guān)閉思考功能，模型仍能保持 2.0 Flash 的高速度，并進一步提升性能，兼具高效推理和成本效益。目前處于預(yù)覽階段，支持通過 API 在 Google AI Studio 和 Vertex AI …
AI模型
- 3.2k
- 0
AIHub4月18日
豆包1.5·深度思考模型：火山引擎推出的AI推理模型

在數(shù)學(xué)、編程、科學(xué)推理等專業(yè)領(lǐng)域及創(chuàng)意寫作等通用任務(wù)中表現(xiàn)突出，在AIME 2024、Codeforces、GPQA等多項權(quán)威基準(zhǔn)上達到或接近業(yè)界第一梯隊水平。支持128k上下文窗口，16k輸出。
AI模型
- 3.6k
- 0
AIHub4月17日
減單 - 安徽醫(yī)科大學(xué)等推出的體重管理大模型智能助手

“減單”是由安徽醫(yī)科大學(xué)聯(lián)合中國科學(xué)技術(shù)大學(xué)附屬第一醫(yī)院和健康科技企業(yè)共同發(fā)布的體重管理大模型智能助手。它基于國內(nèi)外多個AI大模型技術(shù)，結(jié)合超過40萬名肥胖相關(guān)慢性疾病患者的管理數(shù)據(jù)訓(xùn)練而成，旨在借助AI技術(shù)提高減重的個性化干預(yù)質(zhì)量和診療效率。
AI模型
- 3.2k
- 0
AIHub3月24日
Skywork R1V：昆侖萬維開源的多模態(tài)視覺思維鏈推理模型

Skywork R1V 是昆侖萬維開源的多模態(tài)視覺思維鏈推理模型，專注于通過多步邏輯推理解決復(fù)雜的視覺任務(wù)。它結(jié)合了強大的文本推理能力和視覺理解能力，能夠處理視覺邏輯推理、數(shù)學(xué)問題、科學(xué)現(xiàn)象分析等任務(wù)。
AI模型
- 1.5k
- 0
AIHub3月18日
Gemma 3：Google 推出的輕量級高性能開源模型，支持單個GPU運行

Gemma 3 是 Google 推出的輕量級、高性能開源模型，支持多種尺寸（1B、4B、12B 和 27B），專為單 GPU 或 TPU 設(shè)計。它支持 140 多種語言，具備高級文本和視覺推理能力，配備 128k-token 上下文窗口和函數(shù)調(diào)用功能，支持復(fù)雜任務(wù)處理。Gemma 3 提供量化版本，優(yōu)化性能，降低計算需求，并配備安全特性。它無縫集成多種開發(fā)工具，支持靈活部署，助力開發(fā)者快速構(gòu)建高…
AI模型
- 7.9k
- 0
AIHub3月13日
QwQ-32B：阿里云開源的最新AI推理模型，更小尺寸，消費級顯卡即可部署

QwQ-32B 是阿里云開源的320億參數(shù)推理模型，具備強大的數(shù)學(xué)、代碼和通用推理能力，性能比肩全球頂尖開源模型。它支持消費級顯卡部署，降低硬件門檻，同時集成智能體能力，可靈活調(diào)整推理過程。采用Apache 2.0協(xié)議開源，用戶可免費下載、商用和定制化開發(fā)，推動AI技術(shù)的廣泛應(yīng)用。
AI模型
- 10.2k
- 0
AIHub3月6日
SpeciesNet - 谷歌開源的AI模型，助力野生動物識別和保護

SpeciesNet是谷歌開源的一款A(yù)I模型，專為識別野生動物而設(shè)計。它通過分析相機陷阱拍攝的照片，能夠?qū)D像分類為超過2000個標(biāo)簽，涵蓋動物物種、分類群和非動物對象。模型基于6500萬張圖像訓(xùn)練，具備高準(zhǔn)確性和廣泛適用性，采用Apache 2.0開源許可，助力生物多樣性研究和保護。
AI模型
- 2.5k
- 0
AIHub3月4日
企業(yè)微信接入DeepSeek，開啟智能化辦公新紀(jì)元

2025年2月21日，企業(yè)微信宣布正式接入DeepSeek R1，并同步支持騰訊混元大模型。此次更新帶來了多項基于AI的功能升級，包括“智能機器人”和“智能表格-客戶跟進總結(jié)”，旨在大幅提升企業(yè)內(nèi)部協(xié)作和客戶服務(wù)的效率。
AI資訊
- 1.9k
- 0
AIHub2月21日