Agent TARS是什么?
Agent TARS 是字節(jié)跳動(dòng)開源的多模態(tài) AI 代理工具,可視覺化解讀網(wǎng)頁(yè)并簡(jiǎn)化瀏覽器操作,同時(shí)與命令行和文件系統(tǒng)無(wú)縫集成。它具備代理工作流編排、全面工具支持(如瀏覽器、文件編輯、CLI 等)和實(shí)時(shí)Artifact展示等功能。目前支持 macOS,用戶可通過配置模型與搜索設(shè)置后使用,并能分享對(duì)話線程。

Agent TARS的主要特點(diǎn)
- 多模態(tài)與多工具集成
- 支持瀏覽網(wǎng)頁(yè)、集成命令行和文件系統(tǒng),利用瀏覽器操作。
- 集成多種工具,包括搜索、文件編輯、命令行等。
- 支持 MCP(模型上下文協(xié)議),可擴(kuò)展性強(qiáng),能處理復(fù)雜工作流程。
- 任務(wù)規(guī)劃與執(zhí)行:通過 Agent 框架規(guī)劃和執(zhí)行復(fù)雜任務(wù),如深度研究(Deep Research)和電腦操作員(Operator)功能。
- 人機(jī)協(xié)作:支持人機(jī)協(xié)作,用戶可以通過輸入框與 Agent 交互,甚至在工作過程中改變 Agent 的工作方向。
- 桌面客戶端功能:提供桌面客戶端,展示瀏覽器、多模態(tài)元素、會(huì)話管理、模型配置、對(duì)話流程和狀態(tài)跟蹤等功能。
- 分享功能:支持分享結(jié)果,包括本地打包為 HTML 文件和遠(yuǎn)程分享兩種模式。
Agent TARS的使用案例
- 特斯拉未來股價(jià)走勢(shì)的技術(shù)分析:https://agent-tars.com/showcase/tesla-stock-technical-analysis
- 最受歡迎的 5 個(gè) ProductHunt 項(xiàng)目分析報(bào)告:https://agent-tars.com/showcase/producthunt-top-projects-analysis
- 特斯拉近期股價(jià)下跌的原因:https://agent-tars.com/showcase/tesla-stock-decline-reasons
- 從紐約前往墨西哥城的 7 天旅行計(jì)劃:https://agent-tars.com/showcase/7-day-trip-plan-to-mexico-city
如何使用Agent TARS?
Agent TARS提供了開源版本和桌面客戶端:
一、開源版本:
Agent TARS GitHub倉(cāng)庫(kù):https://github.com/bytedance/UI-TARS-desktop/tree/main/apps/agent-tars
克隆GitHub開源代碼,自行部署體驗(yàn)。
二、客戶端版本:
1. 下載與安裝
- 下載:訪問 Agent TARS 官網(wǎng),下載最新版本。
- 安裝:
- macOS:將下載的 Agent TARS 應(yīng)用程序拖到 Applications 文件夾中,并在系統(tǒng)設(shè)置中啟用“可訪問性”和“屏幕錄制”權(quán)限。
- Windows:目前 Agent TARS 主要支持 macOS,Windows 支持正在開發(fā)中。
2. 配置
- 打開 Agent TARS 應(yīng)用程序,點(diǎn)擊左下角按鈕進(jìn)入設(shè)置頁(yè)面。
- 模型配置:設(shè)置模型提供商和 API 密鑰。如果使用 Azure OpenAI,還需設(shè)置
apiVersion
、deploymentName
和endpoint
。 - 搜索配置:設(shè)置搜索提供商和 API 密鑰。
3. 使用
- 輸入任務(wù):在輸入框中輸入任務(wù)指令,Agent TARS 會(huì)根據(jù)指令執(zhí)行相應(yīng)操作。
- 人機(jī)協(xié)作:在任務(wù)執(zhí)行過程中,可以通過輸入框與 Agent 交互,甚至改變?nèi)蝿?wù)方向。
- 分享結(jié)果:完成任務(wù)后,可以通過頂部菜單的分享按鈕,選擇本地打包為 HTML 或遠(yuǎn)程分享。
注意事項(xiàng):Agent TARS 目前處于技術(shù)預(yù)覽階段,建議不要在生產(chǎn)環(huán)境中使用。
