
騰訊開源智能體新框架:不用訓練無需充值,用開源模型實現 SOTA Agent

騰訊優圖實驗室開源了 Youtu-agent,一個高效、易用的智能體框架,旨在解決研究者和開發者在智能體應用中遇到的高門檻和複雜依賴問題。Youtu-agent 無需訓練模型或依賴閉源 API,已在多個基準測試中展現出領先性能,支持低成本部署,兼容多種模型 API,用户可通過簡單配置快速生成智能體。
智能體(Agent)正成為大模型落地的關鍵載體。無論是研究探索還是實際應用,高效、易用、可復現的智能體框架,都是推動智能體生態發展的基礎設施。
然而,研究者和開發者卻常常遇到一些難題:例如上手門檻高、依賴環境複雜、實驗難以復現,以及動輒需要訓練模型或者充值海外昂貴的閉源模型 API 才能取得可靠的效果表現。
為此,騰訊優圖實驗室正式開源Youtu-agent ——一個簡單而強大的智能體框架,兼顧極簡設計與高性能表現,既能服務科研基線需求,也能支撐實際應用構建,最重要的是不需要訓練模型、不依賴閉源 API,就能取得極佳的效果表現。

在多個挑戰性基準上,Youtu-agent 已展現出領先的性能:
-
WebWalkerQA:基於 DeepSeek-V3.1 達到71.47%準確率,刷新開源效果 SOTA; -
GAIA(文本子集):基於 DeepSeek-V3 Pass@1 達到72.8%,不用充值 Claude/GPT 等閉源模型,驗證了強大的研究和應用潛力。
這意味着,Youtu-agent 在完全開源可復現的條件下,已經接近甚至超越部分依賴付費工具的智能體框架。
開箱即用
總體來看,Youtu-agent 具有以下核心亮點
1、開源友好&成本敏感
完全基於開源生態,不依賴封閉模型,適配可訪問、低成本的部署環境。
2、靈活架構
構建於 openai-agents 之上,兼容 DeepSeek、gpt-oss 等多類模型 API 與工具集。
3、自動智能體生成
基於 YAML 配置和 “元智能體” 對話機制,用户只需描述需求,即可一鍵生成並運行智能體配置。
4、簡潔高效
模塊化 + 異步化設計,支持 streaming、tracing 與 agent-loop,高效調試與擴展。
更關鍵的是 Youtu-agent 並非實驗室裏的 “紙上框架”,而是面向真實場景的即用型智能體工具。
研究團隊梳理了四個典型案例,覆蓋文件管理、數據分析、學術研究與廣域綜述,展示了框架的靈活性與實用性。
案例 1:本地文件管理
在助教批改作業的場景中,用户只需將學生提交的文件放入指定文件夾。Youtu-agent 啓動後會依次掃描所有文件,首先判斷格式是否為 PDF。
如果是 PDF,則根據規則自動重命名為 “學號 - 姓名” 的規範格式;如果不是 PDF,則將其歸檔到獨立的文件夾。整個過程無需人工干預,從文件識別到命名再到分類歸檔,一氣呵成。
案例 2:數據分析
當面對 Kaggle 數據集中的 cat_breeds_clean.csv 文件時,用户只需給出路徑。Youtu-agent 讀取 CSV 內容,經過數據清洗和統計分析後,會自動生成結構化的結論與趨勢,並轉化為一份直觀的 HTML 報告。
這個過程中,原始數據被逐步轉化為高價值的信息:從表格讀取、到統計提取、再到結果可視化,形成完整的流水線。
案例 3:論文分析
在科研工作中,研究者只需輸入一篇 PDF 論文。Youtu-agent 首先解析文檔內容,抽取核心部分;隨後調用搜索工具,在外部檢索與其相關的研究工作;最後將論文解讀與外部成果整合,生成一份 Markdown 報告。
整個過程就像一個 “論文助理”:先讀懂論文,再去查找對照,最後寫出一份條理清晰的研究筆記。
案例 4:Wide Research
當用户輸入一個廣域主題時,Youtu-agent 便進入複合模式。它先調用搜索工具,收集大量分散的信息;再使用文檔處理工具進行整理;最後由智能體進行分析與總結,生成一份結構化的 Markdown 綜述。
這個過程相當於把 “調研” 自動化:從需求提出,到海量資料收集,再到報告成型,整個鏈條由多個子智能體協同完成。
設計原則:DITA
Youtu-agent 的研究員提出了DITA 原則,總結智能體設計的四個關鍵維度:
-
Demand(需求):明確任務目標,來源於系統提示詞中的 requirements 或用户輸入的 intention。 -
I/O(輸入輸出):定義任務的輸入形式(如 CSV、PDF、str)與輸出形式(如 HTML 報告、Markdown)。 -
Tools(工具):根據任務選擇或生成合適的工具,例如搜索工具、文件處理工具。 -
Agent Pattern(範式):決定智能體的交互模式,例如 single agent、plan-and-execute、compound。

自動化 Agent 生成
除了 DITA 框架之外,Youtu-agent 還特別強調了一個核心亮點:自動化 Agent 生成。
在傳統方式中,用户往往需要自己手動編寫 prompt、配置工具和參數,這不僅對初學者來説存在較高的使用門檻,而且即使是有經驗的用户,也要投入大量的時間成本。Youtu-agent 的解決思路是將這一過程進行標準化與自動化。
具體來説,它採用統一的 YAML 配置格式,將 Agent 的輸入輸出、工具調用和交互範式用結構化的方式加以描述;同時引入了一個 “meta-agent”,用户只需提出任務需求,系統就會通過與用户的交互澄清意圖,並自動生成完整的配置文件。生成的配置可以直接加載並運行,從而實現一鍵測試與使用。
在使用體驗上,用户只需先運行 python scripts/gen_simple_agent.py,meta-agent 會根據需求生成相應的配置;隨後再運行 python scripts/cli_chat.py —stream —config generated/xxx,就能立即啓動並測試生成的 Agent。這一機制大幅度降低了 Agent 的定製難度,讓初學者可以快速上手,同時也幫助高階用户節省了繁瑣的配置和調試時間。
快速上手
對於研究人員/模型訓練師,Youtu-agent 可以作為比 ReAct 更強的開源基線,一鍵評估腳本助力實驗與消融研究。
對於應用開發者,Youtu-agent 可以充當經過驗證的腳手架,輕量上手即可構建真實智能體應用。
對於 AI 愛好者,Youtu-agent 具備豐富示例與可調試性,能讓開發與探索直觀高效。

那麼這個智能體框架要怎麼用?很簡單,Youtu-agent 在 GitHub 上開源了完整代碼和示例,只要三步就能跑起來:
第一步:獲取代碼
在命令行輸入:

第二步:跑一個最簡單的智能體
Youtu-agent 內置了配置模板,只要寫一個 YAML 文件,就能定義你的智能體行為。項目中提供了一個搭載搜索工具的基礎agent 模板configs/agents/default.yaml,你可以運行下面的代碼一鍵體驗:


第三步:探索更多示例
你也可以嘗試運行官方示例中的更多實用案例,部分示例要求 Agent 具備聯網搜索能力,因此需要在.env 文件內提前配置 tools 模塊內的工具 API:

例如希望 Agent 圍繞"DeepSeek V3.1 新特性"主題,自動聯網檢索信息並生成 SVG 介紹圖片,可以直接運行下面的代碼:

如果想要藉助 web-ui 以可視化方式預覽 Agent 的運行情況,你可以在 Youtu-agent 的 releases 中下載前端 ui 的打包文件並安裝到本地:

運行 web 版本的 SVG 圖片生成命令:


例如,對於 “deepseek-v3.1 有哪些亮點更新?” 這一問題,agent 自行從網絡搜索相關信息,最終生成如下的圖片:

更進階的,還可以用腳本一鍵跑基準評測:

完成評測之後,可以在分析平台上檢查實驗結果:


本文來源:量子位,原文標題:《騰訊開源智能體新框架:不用訓練無需充值,用開源模型實現 SOTA Agent》

