AIHub最新消息,2025年03月12日,OpenAI 推出了一系列新工具和 API,旨在幫助開發(fā)者更輕松地創(chuàng)建能夠自動完成任務(wù)的 AI Agents(智能體)。盡管此前推出的高級推理和多模態(tài)交互模型為 Agent 的開發(fā)奠定了基礎(chǔ),但在構(gòu)建生產(chǎn)級 Agent 時,開發(fā)者仍面臨諸多挑戰(zhàn)。此次發(fā)布的工具包旨在簡化開發(fā)流程,降低技術(shù)門檻。

核心工具與功能
- Responses API:結(jié)合了 Chat Completions API 的簡潔性和 Assistants API 的工具使用能力,開發(fā)者只需調(diào)用一次 API,即可利用多種工具和多輪模型交互解決復(fù)雜任務(wù)。
- 內(nèi)置工具
- Web 搜索工具:支持 GPT-4o 和 GPT-4o-mini 模型訪問互聯(lián)網(wǎng)獲取最新信息,在 SimpleQA 基準(zhǔn)測試中分別達到 90% 和 88% 的準(zhǔn)確率。
- 文件搜索工具:支持多種文件格式,優(yōu)化查詢、過濾元數(shù)據(jù)、自定義排序,幫助開發(fā)者快速從大量文檔中提取關(guān)鍵信息。
- 計算機使用工具:由 Computer-Using Agent (CUA) 模型提供支持,可模擬鼠標(biāo)和鍵盤操作,自動化復(fù)雜任務(wù),支持網(wǎng)頁和桌面應(yīng)用程序。
- Agents SDK:基于 Swarm 框架升級的開源框架,簡化多 Agent 工作流程編排,提供 LLM 與工具集成、Agent 間智能交接控制、可配置安全檢查以及可視化追蹤等功能。

應(yīng)用場景
- 客戶支持自動化:通過 Web 搜索工具幫助資產(chǎn)管理者和法律從業(yè)者提取可行見解。
- AI 旅行 Agent:利用文件搜索工具為用戶提供精準(zhǔn)的旅行政策答案。
- 復(fù)雜操作自動化:通過計算機使用工具自動化傳統(tǒng)系統(tǒng)中的復(fù)雜操作。
- 企業(yè)數(shù)據(jù)搜索:使用 Agents SDK 快速構(gòu)建企業(yè)級數(shù)據(jù)搜索應(yīng)用。
技術(shù)細節(jié)與優(yōu)勢
- Agent 間的無縫交接:支持復(fù)雜任務(wù)的分解和多 Agent 協(xié)同工作,例如從商品推薦到購買再到退貨的全流程自動化。
- 隱私保護機制:通過安全措施(guardrails)和輸入過濾(input_filter)確保用戶數(shù)據(jù)隱私。
- 模型性能優(yōu)化:在多個基準(zhǔn)測試中,CUA 模型表現(xiàn)出色,例如在 WebVoyager 測試中達到 87% 的準(zhǔn)確率。
未來規(guī)劃
- OpenAI 將繼續(xù)支持 Chat Completions API,并計劃在 2026 年中期停用 Assistants API,同時提供詳細的遷移指南。
- 新工具的定價已經(jīng)公布,例如 Web 搜索每千次查詢 30 美元(GPT-4o)和 25 美元(GPT-4o-mini),文件搜索每千次查詢 2.5 美元,計算機使用工具按 token 計費。
OpenAI 的 Agent 工具包為開發(fā)者提供了強大的工具和框架,極大地簡化了 AI Agents 的構(gòu)建和部署流程,推動了 AI 在更多領(lǐng)域的應(yīng)用和普及。
?版權(quán)聲明:如無特殊說明,本站所有內(nèi)容均為AIHub.cn原創(chuàng)發(fā)布和所有。任何個人或組織,在未征得本站同意時,禁止復(fù)制、盜用、采集、發(fā)布本站內(nèi)容到任何網(wǎng)站、書籍等各類媒體平臺。否則,我站將依法保留追究相關(guān)法律責(zé)任的權(quán)利。

