-
OpenAI發(fā)布GPT-OSS:開源權(quán)重大模型,原生支持128K上下文
2025年8月5日,OpenAI 宣布推出全新開放權(quán)重大語言模型系列 GPT-OSS,這是自 GPT-2 以來該機(jī)構(gòu)首次發(fā)布支持本地部署的模型權(quán)重。新系列包括兩個(gè)版本:輕量的 GPT-OSS-20B 和高性能的 GPT-OSS-120B,均采用 Mixture-of-Experts(MoE)架構(gòu),在保持生成能力的同時(shí)顯著降低計(jì)算資源消耗。 相比傳統(tǒng)閉源模型,GPT-OSS 系列具備更強(qiáng)的開放性與可…... -
Manus 推出 Wide Research 功能,多智能體并發(fā)處理大規(guī)模任務(wù)
2025年8月1日,AI智能體平臺(tái) Manus 上線了名為「Wide Research」的新功能,允許用戶通過多個(gè) AI 智能體并發(fā)處理大規(guī)模任務(wù),如批量生成設(shè)計(jì)稿、評(píng)選MBA項(xiàng)目或分析股票表現(xiàn)。這項(xiàng)功能已率先向 Pro 用戶開放,后續(xù)將逐步開放給 Plus 和 Basic 用戶。 Wide Research 的核心亮點(diǎn) 1、系統(tǒng)級(jí)并行處理與智能體協(xié)作 Wide Research 的關(guān)鍵在于其系統(tǒng)…... -
阿里通義開源視頻生成模型 Wan2.2
2025 年 7 月 28 日,阿里巴巴通義實(shí)驗(yàn)室正式開源了 Wan2.2,這是一款專為電影級(jí)視覺控制和高質(zhì)量視頻創(chuàng)作設(shè)計(jì)的開源視頻生成模型。Wan2.2 通過混合專家(MoE)架構(gòu),實(shí)現(xiàn)了對(duì)電影鏡頭語言的深度理解和還原,支持多維度的視覺呈現(xiàn),如光影、色彩和構(gòu)圖。此外,它在數(shù)據(jù)訓(xùn)練規(guī)模和專業(yè)美學(xué)訓(xùn)練上實(shí)現(xiàn)了雙重升級(jí),顯著提升了復(fù)雜場(chǎng)景的表現(xiàn)力和美學(xué)表現(xiàn)能力。 核心功能 文生視頻:具備電影級(jí)視覺控制…... -
GLM-4.5 發(fā)布,面向推理、代碼與智能體的開源 SOTA 模型
2025 年 7 月 28 日,智譜 AI 團(tuán)隊(duì)正式發(fā)布了新一代旗艦?zāi)P?GLM-4.5,這是一款專為智能體應(yīng)用打造的基礎(chǔ)模型,標(biāo)志著開源模型在推理、代碼生成和智能體能力上達(dá)到了新的高度。 GLM-4.5 采用了混合專家(MoE)架構(gòu),總參數(shù)量達(dá) 3550 億,激活參數(shù) 320 億。其姊妹模型 GLM-4.5-Air 則更為精簡(jiǎn),總參數(shù)量 1060 億,激活參數(shù) 120 億。兩者均在 15 萬億 …... -
通義千問發(fā)布Qwen3-Coder,推動(dòng)代理編程領(lǐng)域發(fā)展
近日,阿里通義千問團(tuán)隊(duì)發(fā)布了其最新的編程模型——Qwen3-Coder,旨在為開發(fā)者提供更強(qiáng)大的代碼生成和代理編程能力。Qwen3-Coder-480B-A35B-Instruct 是目前最強(qiáng)大的版本,采用了 4800 億參數(shù)和 35B 激活參數(shù)的 MoE(混合專家)模型,能夠支持原生 256K token 的上下文,并通過 YaRN 技術(shù)擴(kuò)展至 1M token。該模型在代理編程、瀏覽器使用和工…... -
字節(jié)跳動(dòng)發(fā)布 Trae 2.0 ,全新 SOLO 模式來襲
近日,字節(jié)跳動(dòng)推出了 Trae 2.0,帶來了革命性的 SOLO 模式,致力于改變傳統(tǒng)軟件開發(fā)的工作流程。SOLO 模式不僅是一個(gè)“寫代碼的機(jī)器人”,它被重新定義為一位“上下文工程師”,能夠理解整個(gè)開發(fā)過程中的產(chǎn)品需求、技術(shù)方案、代碼編寫、調(diào)試和部署等環(huán)節(jié),無需工具切換或重復(fù)溝通。 產(chǎn)品亮點(diǎn) 一體化 SOLO 模式:Trae SOLO 能夠獨(dú)立完成從需求生成到產(chǎn)品部署的全過程。它集成了編輯器、瀏覽…... -
OpenAI 正式發(fā)布AI智能體 ChatGPT Agent
2025 年 7 月 18 日,OpenAI 正式發(fā)布 ChatGPT Agent,這一創(chuàng)新工具將 AI 的對(duì)話能力與網(wǎng)絡(luò)交互能力深度融合,為用戶帶來前所未有的自動(dòng)化任務(wù)處理體驗(yàn)。ChatGPT Agent能夠理解自然語言指令,主動(dòng)選擇并使用合適的網(wǎng)絡(luò)工具完成復(fù)雜任務(wù),如財(cái)務(wù)研究、在線表格填寫、幻燈片制作等,顯著提升工作效率。 核心功能亮點(diǎn) 任務(wù)自動(dòng)化:ChatGPT Agent可處理多種復(fù)雜任務(wù)…... -
美圖推出RoboNeo,專注影像生產(chǎn)力的 AI 智能體
近日,美圖公司正式推出 RoboNeo,一款專注于影像生產(chǎn)力的 AI 智能體產(chǎn)品。RoboNeo 旨在通過自然語言交互,幫助用戶輕松完成修圖、設(shè)計(jì)和視頻制作等任務(wù),讓每位用戶都能成為“發(fā)號(hào)施令的甲方”,僅通過語音指令即可完成復(fù)雜的視覺創(chuàng)作需求。 RoboNeo 的核心功能包括智能修圖、AI 設(shè)計(jì)生成、視頻智能處理和多模態(tài)創(chuàng)作。用戶可以通過簡(jiǎn)單的指令,如“幫我換一個(gè)新發(fā)型”或“把背景換成海邊”,快速…... -
字節(jié)跳動(dòng)推出小荷 AI 醫(yī)生,開啟健康管理便捷新時(shí)代?
近日,字節(jié)跳動(dòng)正式推出其首款獨(dú)立 AI 醫(yī)療助手應(yīng)用 ——“小荷 AI 醫(yī)生”,致力于為用戶打造貼心專屬的健康管家,標(biāo)志著公司在醫(yī)療科技領(lǐng)域邁出重要一步。? 小荷 AI 醫(yī)生功能豐富且實(shí)用。在健康咨詢方面,用戶無需排隊(duì)掛號(hào),隨時(shí)隨地就能獲取專業(yè)健康指導(dǎo)。無論是疾病自查、用藥參考,還是日常健康建議,它都能快速響應(yīng)。并且,該應(yīng)用會(huì)主動(dòng)收集如癥狀持續(xù)時(shí)間、過敏史等關(guān)鍵信息,讓給出的解答更全面、精準(zhǔn)和個(gè)性…... -
B站推出“代號(hào)H”AI創(chuàng)作工具,發(fā)力視頻播客
2025年7月7日,B站宣布推出內(nèi)部代號(hào)為“代號(hào)H”的AI創(chuàng)作工具,并同步啟動(dòng)視頻播客創(chuàng)作者扶持計(jì)劃,標(biāo)志著平臺(tái)在AI內(nèi)容創(chuàng)作領(lǐng)域的又一重要布局。 “代號(hào)H”是一款專為視頻播客創(chuàng)作者設(shè)計(jì)的AI工具,支持文案與音頻兩種輸入格式,可自動(dòng)生成與內(nèi)容匹配的視頻畫面。該工具目前主要適配播客及泛知識(shí)雜談?lì)悆?nèi)容,具備高效生成能力——千字內(nèi)容可在6分鐘內(nèi)完成視頻制作,未來有望進(jìn)一步壓縮至3分鐘。據(jù)內(nèi)部人士透露,工…... -
阿里推出ThinkSound音頻生成模型,可像“專業(yè)音效師”一樣思考
2025年7月4日,阿里通義實(shí)驗(yàn)室正式發(fā)布了旗下首個(gè)音頻生成模型——ThinkSound。這一突破性技術(shù)首次將思維鏈(CoT)概念應(yīng)用于音頻生成領(lǐng)域,讓AI可以像“專業(yè)音效師”一樣理解畫面事件與聲音的關(guān)系,突破了傳統(tǒng)音頻生成的局限。 ThinkSound的核心亮點(diǎn)在于其精確的空間音頻生成能力,不僅能夠?yàn)橐曨l畫面配音,更能根據(jù)畫面內(nèi)容做出深入的推理,生成高保真、時(shí)序精確的音效。這一技術(shù)的發(fā)布,將大大…... -
豆包上線“深入研究”功能,支持免費(fèi)體驗(yàn)
2025年6月30日,豆包宣布其全新功能“深入研究”已在豆包App、網(wǎng)頁版和電腦版正式開啟測(cè)試,用戶可以免費(fèi)體驗(yàn)這一功能。 ? 立即免費(fèi)體驗(yàn):www.doubao.com “深入研究”功能基于強(qiáng)大的搜索、推理和Agent能力,旨在幫助用戶高效、全面地處理復(fù)雜任務(wù)。無論是長(zhǎng)途旅行攻略、復(fù)雜購買決策、最新政策解讀,還是商業(yè)科技趨勢(shì)等需要大量資料和時(shí)間研究的問題,借助這一功能,用戶可以在幾分鐘內(nèi)生成初步…... -
百度正式開源文心4.5系列模型
2025年6月30日,百度宣布文心4.5系列模型正式開源。此次開源包括10款不同規(guī)模的模型,其中包括參數(shù)量為47B和3B的混合專家(MoE)模型,以及0.3B的稠密參數(shù)模型。文心4.5的開源文件包括預(yù)訓(xùn)練權(quán)重和推理代碼,已上傳至Hugging Face、GitHub以及飛槳星河社區(qū),供全球開發(fā)者使用。 主要技術(shù)特點(diǎn) 1. 多模態(tài)混合專家模型預(yù)訓(xùn)練 文心4.5通過聯(lián)合訓(xùn)練文本和視覺兩種模態(tài)來提高模型…... -
美團(tuán)推出智能經(jīng)營助手“袋鼠參謀”,助力中小商家精細(xì)化運(yùn)營
AIHub最新消息,近日美團(tuán)推出AI智能運(yùn)營輔助產(chǎn)品 “袋鼠參謀”,定位為基于大語言模型的本地商業(yè)智能助手,專為中小商家提供營銷診斷、經(jīng)營優(yōu)化、行業(yè)數(shù)據(jù)解讀等多項(xiàng)實(shí)用功能。 袋鼠參謀融合美團(tuán)多年積累的本地生活服務(wù)數(shù)據(jù)與AI能力,具備強(qiáng)大的自然語言理解與多模態(tài)交互能力,支持商家通過文字、語音、圖片、文件等方式提出問題,系統(tǒng)可實(shí)時(shí)生成個(gè)性化的運(yùn)營建議與決策支持。無論是選址開店、菜品優(yōu)化,還是營銷轉(zhuǎn)化、…... -
阿里通義千問宣布推出多模態(tài)模型 Qwen VLo,實(shí)現(xiàn)從感知到生成的跨越
2025年6月26日,阿里巴巴達(dá)摩院通義千問團(tuán)隊(duì)正式發(fā)布其最新多模態(tài)模型 —— Qwen VLo,標(biāo)志著通義在圖文理解與生成能力上的重大突破,實(shí)現(xiàn)了從“看懂”世界到“描繪”世界的跨越式提升。 Qwen VLo 是一款統(tǒng)一的視覺-語言模型,具備圖文雙向交互能力,不僅能理解圖像內(nèi)容,還可根據(jù)自然語言指令進(jìn)行高質(zhì)量圖像生成與編輯。模型支持風(fēng)格遷移、背景更換、物體添加等復(fù)雜視覺操作,同時(shí)具備視覺感知任務(wù)能…...