全部標(biāo)簽

AI資訊

OpenAI發(fā)布GPT-OSS：開源權(quán)重大模型，原生支持128K上下文

2025年8月5日，OpenAI 宣布推出全新開放權(quán)重大語言模型系列 GPT-OSS，這是自 GPT-2 以來該機(jī)構(gòu)首次發(fā)布支持本地部署的模型權(quán)重。新系列包括兩個(gè)版本：輕量的 GPT-OSS-20B 和高性能的 GPT-OSS-120B，均采用 Mixture-of-Experts（MoE）架構(gòu)，在保持生成能力的同時(shí)顯著降低計(jì)算資源消耗。相比傳統(tǒng)閉源模型，GPT-OSS 系列具備更強(qiáng)的開放性與可…...
- 8月6日
Manus 推出 Wide Research 功能，多智能體并發(fā)處理大規(guī)模任務(wù)

2025年8月1日，AI智能體平臺(tái) Manus 上線了名為「Wide Research」的新功能，允許用戶通過多個(gè) AI 智能體并發(fā)處理大規(guī)模任務(wù)，如批量生成設(shè)計(jì)稿、評(píng)選MBA項(xiàng)目或分析股票表現(xiàn)。這項(xiàng)功能已率先向 Pro 用戶開放，后續(xù)將逐步開放給 Plus 和 Basic 用戶。 Wide Research 的核心亮點(diǎn) 1、系統(tǒng)級(jí)并行處理與智能體協(xié)作 Wide Research 的關(guān)鍵在于其系統(tǒng)…...
- 8月1日
阿里通義開源視頻生成模型 Wan2.2

2025 年 7 月 28 日，阿里巴巴通義實(shí)驗(yàn)室正式開源了 Wan2.2，這是一款專為電影級(jí)視覺控制和高質(zhì)量視頻創(chuàng)作設(shè)計(jì)的開源視頻生成模型。Wan2.2 通過混合專家（MoE）架構(gòu)，實(shí)現(xiàn)了對(duì)電影鏡頭語言的深度理解和還原，支持多維度的視覺呈現(xiàn)，如光影、色彩和構(gòu)圖。此外，它在數(shù)據(jù)訓(xùn)練規(guī)模和專業(yè)美學(xué)訓(xùn)練上實(shí)現(xiàn)了雙重升級(jí)，顯著提升了復(fù)雜場(chǎng)景的表現(xiàn)力和美學(xué)表現(xiàn)能力。核心功能文生視頻：具備電影級(jí)視覺控制…...
- 7月29日
GLM-4.5 發(fā)布，面向推理、代碼與智能體的開源 SOTA 模型

2025 年 7 月 28 日，智譜 AI 團(tuán)隊(duì)正式發(fā)布了新一代旗艦?zāi)Ｐ?GLM-4.5，這是一款專為智能體應(yīng)用打造的基礎(chǔ)模型，標(biāo)志著開源模型在推理、代碼生成和智能體能力上達(dá)到了新的高度。 GLM-4.5 采用了混合專家（MoE）架構(gòu)，總參數(shù)量達(dá) 3550 億，激活參數(shù) 320 億。其姊妹模型 GLM-4.5-Air 則更為精簡(jiǎn)，總參數(shù)量 1060 億，激活參數(shù) 120 億。兩者均在 15 萬億 …...
- 7月29日
通義千問發(fā)布Qwen3-Coder，推動(dòng)代理編程領(lǐng)域發(fā)展

近日，阿里通義千問團(tuán)隊(duì)發(fā)布了其最新的編程模型——Qwen3-Coder，旨在為開發(fā)者提供更強(qiáng)大的代碼生成和代理編程能力。Qwen3-Coder-480B-A35B-Instruct 是目前最強(qiáng)大的版本，采用了 4800 億參數(shù)和 35B 激活參數(shù)的 MoE（混合專家）模型，能夠支持原生 256K token 的上下文，并通過 YaRN 技術(shù)擴(kuò)展至 1M token。該模型在代理編程、瀏覽器使用和工…...
- 7月23日
字節(jié)跳動(dòng)發(fā)布 Trae 2.0 ，全新 SOLO 模式來襲

近日，字節(jié)跳動(dòng)推出了 Trae 2.0，帶來了革命性的 SOLO 模式，致力于改變傳統(tǒng)軟件開發(fā)的工作流程。SOLO 模式不僅是一個(gè)“寫代碼的機(jī)器人”，它被重新定義為一位“上下文工程師”，能夠理解整個(gè)開發(fā)過程中的產(chǎn)品需求、技術(shù)方案、代碼編寫、調(diào)試和部署等環(huán)節(jié)，無需工具切換或重復(fù)溝通。產(chǎn)品亮點(diǎn) 一體化 SOLO 模式：Trae SOLO 能夠獨(dú)立完成從需求生成到產(chǎn)品部署的全過程。它集成了編輯器、瀏覽…...
- 7月22日
OpenAI 正式發(fā)布AI智能體 ChatGPT Agent

2025 年 7 月 18 日，OpenAI 正式發(fā)布 ChatGPT Agent，這一創(chuàng)新工具將 AI 的對(duì)話能力與網(wǎng)絡(luò)交互能力深度融合，為用戶帶來前所未有的自動(dòng)化任務(wù)處理體驗(yàn)。ChatGPT Agent能夠理解自然語言指令，主動(dòng)選擇并使用合適的網(wǎng)絡(luò)工具完成復(fù)雜任務(wù)，如財(cái)務(wù)研究、在線表格填寫、幻燈片制作等，顯著提升工作效率。核心功能亮點(diǎn) 任務(wù)自動(dòng)化：ChatGPT Agent可處理多種復(fù)雜任務(wù)…...
- 7月18日
美圖推出RoboNeo，專注影像生產(chǎn)力的 AI 智能體

近日，美圖公司正式推出 RoboNeo，一款專注于影像生產(chǎn)力的 AI 智能體產(chǎn)品。RoboNeo 旨在通過自然語言交互，幫助用戶輕松完成修圖、設(shè)計(jì)和視頻制作等任務(wù)，讓每位用戶都能成為“發(fā)號(hào)施令的甲方”，僅通過語音指令即可完成復(fù)雜的視覺創(chuàng)作需求。 RoboNeo 的核心功能包括智能修圖、AI 設(shè)計(jì)生成、視頻智能處理和多模態(tài)創(chuàng)作。用戶可以通過簡(jiǎn)單的指令，如“幫我換一個(gè)新發(fā)型”或“把背景換成海邊”，快速…...
- 7月17日
字節(jié)跳動(dòng)推出小荷 AI 醫(yī)生，開啟健康管理便捷新時(shí)代?

近日，字節(jié)跳動(dòng)正式推出其首款獨(dú)立 AI 醫(yī)療助手應(yīng)用 ——“小荷 AI 醫(yī)生”，致力于為用戶打造貼心專屬的健康管家，標(biāo)志著公司在醫(yī)療科技領(lǐng)域邁出重要一步。? 小荷 AI 醫(yī)生功能豐富且實(shí)用。在健康咨詢方面，用戶無需排隊(duì)掛號(hào)，隨時(shí)隨地就能獲取專業(yè)健康指導(dǎo)。無論是疾病自查、用藥參考，還是日常健康建議，它都能快速響應(yīng)。并且，該應(yīng)用會(huì)主動(dòng)收集如癥狀持續(xù)時(shí)間、過敏史等關(guān)鍵信息，讓給出的解答更全面、精準(zhǔn)和個(gè)性…...
- 7月9日
B站推出“代號(hào)H”AI創(chuàng)作工具，發(fā)力視頻播客

2025年7月7日，B站宣布推出內(nèi)部代號(hào)為“代號(hào)H”的AI創(chuàng)作工具，并同步啟動(dòng)視頻播客創(chuàng)作者扶持計(jì)劃，標(biāo)志著平臺(tái)在AI內(nèi)容創(chuàng)作領(lǐng)域的又一重要布局。 “代號(hào)H”是一款專為視頻播客創(chuàng)作者設(shè)計(jì)的AI工具，支持文案與音頻兩種輸入格式，可自動(dòng)生成與內(nèi)容匹配的視頻畫面。該工具目前主要適配播客及泛知識(shí)雜談?lì)悆?nèi)容，具備高效生成能力——千字內(nèi)容可在6分鐘內(nèi)完成視頻制作，未來有望進(jìn)一步壓縮至3分鐘。據(jù)內(nèi)部人士透露，工…...
- 7月7日
阿里推出ThinkSound音頻生成模型，可像“專業(yè)音效師”一樣思考

2025年7月4日，阿里通義實(shí)驗(yàn)室正式發(fā)布了旗下首個(gè)音頻生成模型——ThinkSound。這一突破性技術(shù)首次將思維鏈（CoT）概念應(yīng)用于音頻生成領(lǐng)域，讓AI可以像“專業(yè)音效師”一樣理解畫面事件與聲音的關(guān)系，突破了傳統(tǒng)音頻生成的局限。 ThinkSound的核心亮點(diǎn)在于其精確的空間音頻生成能力，不僅能夠?yàn)橐曨l畫面配音，更能根據(jù)畫面內(nèi)容做出深入的推理，生成高保真、時(shí)序精確的音效。這一技術(shù)的發(fā)布，將大大…...
- 7月4日
豆包上線“深入研究”功能，支持免費(fèi)體驗(yàn)

2025年6月30日，豆包宣布其全新功能“深入研究”已在豆包App、網(wǎng)頁版和電腦版正式開啟測(cè)試，用戶可以免費(fèi)體驗(yàn)這一功能。 ? 立即免費(fèi)體驗(yàn)：www.doubao.com “深入研究”功能基于強(qiáng)大的搜索、推理和Agent能力，旨在幫助用戶高效、全面地處理復(fù)雜任務(wù)。無論是長(zhǎng)途旅行攻略、復(fù)雜購買決策、最新政策解讀，還是商業(yè)科技趨勢(shì)等需要大量資料和時(shí)間研究的問題，借助這一功能，用戶可以在幾分鐘內(nèi)生成初步…...
- 7月1日
百度正式開源文心4.5系列模型

2025年6月30日，百度宣布文心4.5系列模型正式開源。此次開源包括10款不同規(guī)模的模型，其中包括參數(shù)量為47B和3B的混合專家（MoE）模型，以及0.3B的稠密參數(shù)模型。文心4.5的開源文件包括預(yù)訓(xùn)練權(quán)重和推理代碼，已上傳至Hugging Face、GitHub以及飛槳星河社區(qū)，供全球開發(fā)者使用。主要技術(shù)特點(diǎn) 1. 多模態(tài)混合專家模型預(yù)訓(xùn)練文心4.5通過聯(lián)合訓(xùn)練文本和視覺兩種模態(tài)來提高模型…...
- 7月1日
美團(tuán)推出智能經(jīng)營助手“袋鼠參謀”，助力中小商家精細(xì)化運(yùn)營

AIHub最新消息，近日美團(tuán)推出AI智能運(yùn)營輔助產(chǎn)品 “袋鼠參謀”，定位為基于大語言模型的本地商業(yè)智能助手，專為中小商家提供營銷診斷、經(jīng)營優(yōu)化、行業(yè)數(shù)據(jù)解讀等多項(xiàng)實(shí)用功能。袋鼠參謀融合美團(tuán)多年積累的本地生活服務(wù)數(shù)據(jù)與AI能力，具備強(qiáng)大的自然語言理解與多模態(tài)交互能力，支持商家通過文字、語音、圖片、文件等方式提出問題，系統(tǒng)可實(shí)時(shí)生成個(gè)性化的運(yùn)營建議與決策支持。無論是選址開店、菜品優(yōu)化，還是營銷轉(zhuǎn)化、…...
- 6月29日
阿里通義千問宣布推出多模態(tài)模型 Qwen VLo，實(shí)現(xiàn)從感知到生成的跨越

2025年6月26日，阿里巴巴達(dá)摩院通義千問團(tuán)隊(duì)正式發(fā)布其最新多模態(tài)模型 —— Qwen VLo，標(biāo)志著通義在圖文理解與生成能力上的重大突破，實(shí)現(xiàn)了從“看懂”世界到“描繪”世界的跨越式提升。 Qwen VLo 是一款統(tǒng)一的視覺-語言模型，具備圖文雙向交互能力，不僅能理解圖像內(nèi)容，還可根據(jù)自然語言指令進(jìn)行高質(zhì)量圖像生成與編輯。模型支持風(fēng)格遷移、背景更換、物體添加等復(fù)雜視覺操作，同時(shí)具備視覺感知任務(wù)能…...
- 6月28日