作者 | 黃昱 互聯網大廠將齊聚在又一個火熱的新戰場——桌面 Agent。 2 月 6 日,當 “騰訊雲代碼助手 CodeBuddy” 官方賬號正式宣佈桌面 Agent 工具 “WorkBuddy” 啓動內測時,這場備受關注的 “桌面大考”,又迎來了一個重量級玩家。 騰訊雲 CodeBuddy 團隊對華爾街見聞表示,WorkBuddy 在騰訊內部很早就推出了,旨在幫助公司內非開發者也能提高日常的效率。如今看到很多辦公人羣、研究人羣、各行各業,對於 “應用來解決日常任務” 的訴求越來越強烈,所以基於 CodeBuddy 目前成熟的 AI Coding 基建,推出了輕量便捷極簡的產品設計風格。 “我們會繼續深度打磨用户反饋,然後在上半年找合適的時間正式推出這個產品。” 與時下火熱的 OpenClaw 能夠調取系統級權限和更靈活的操作不同,WorkBuddy 的定位更多是 “通過讀取電腦上的經授權文件夾,實現多類自主操作”。 這意味着,WorkBuddy 的場景更多是明確文件夾約束下的有限操作。 這或許也折射了騰訊在該領域的 “減法式” 產品思考——它假設大多數職場人不僅關心 “能不能把事做完”,也擔心 AI 會不會捅婁子,於是選擇的產品路線並不激進,而是看重穩定、可複用、可交付的執行結果。 WorkBuddy 的推出,不僅標誌着騰訊正式加入桌面 Agent 工具的市場競爭,更可視為大廠試圖通過 “智能體” 這一新變量,重新定義職場效率邊界的重要信號。 騰訊入局的時機,恰好踩在了全球桌面 Agent 爆發的臨界點上。 就在不久前,OpenClaw 等產品在技術社區迅速走紅,用户驚歎於 AI 能夠深度訪問電腦系統、文件、甚至自主執行跨應用任務。 這種被稱為 “24 小時待命賈維斯” 的體驗,讓業界直言 “桌面 Agent 的 ChatGPT 時刻” 已經到來。 相比於目前市面上火爆的同類工具,WorkBuddy 沒有走純極客路線,而是定位為面向非技術背景的職場人羣。 這意味着,它不再要求用户具備編程知識,只需要通過自然語言描述需求,它就能像一個 “懂行” 的同事一樣去執行任務。這種從 “技術工具” 向 “職場助手” 的範式轉移,是騰訊對桌面 Agent 大眾化的一次大膽嘗試。 據介紹,WorkBuddy 可以直接在本地電腦自主規劃並執行多模態複雜任務。具體來看,WorkBuddy 具備兩大特點: 一是深度本地操作能力:,能夠 “聽懂人話” 並 “真能操作本地文件”。 在獲得授權後,它可以讀取文件夾、批量處理文件、生成文檔或 PPT 數據深度分析、行業調研、多任務 Agent 並行處理等。這意味着,它打破了傳統 AI“只能看、不能動” 的尷尬局面,真正切入了辦公的最後一公里。 二是多步驟任務的自主規劃,與簡單的指令響應不同,WorkBuddy 強調 “帶腦子思考”。 此外,WorkBuddy 還內置了多種海內外的模型和主流 MCP Server 和 Skills 技能包等高階功能,這使其在保持簡單易用的同時,具備了極強的擴展性,能夠應對金融、調研、創作等垂直細分場景的深度需求。 華爾街見聞獲悉,WorkBuddy 由騰訊雲 CodeBuddy 團隊開發,此前已在騰訊內部推出並啓動內測,目前已經有超過 2000 名不同崗位員工參與深度使用,並在數據處理與分析、構建本地知識庫、內容文案創作、海報生成、自動化辦公等場景獲得廣泛應用。 長期以來,儘管大模型在對話框裏表現得無所不知,但當用户回到真實的辦公場景,面對繁雜的本地文件、瑣碎的多任務切換時,大模型往往顯得 “手腳受限”。 如今,隨着 AI 競爭進入下半場,行業競賽的焦點正在從 “比拼模型參數” 轉向 “比拼落地能力”。單純的聊天機器人已經無法滿足職場人複雜、細碎且極度依賴本地文件的需求。誰能先佔據用户的電腦桌面,誰就拿到了通往下一代 “AI 操作系統” 的門票。 OpenClaw 等工具的爆紅已經證明了用户對於 “能跑在自己電腦裏、深度操作應用” 的 Agent 有着極度飢渴的需求。 騰訊此時出手,既是為了在一眾先行者的包圍中搶佔生態位,也是為了將其深耕多年的企業服務能力,通過 Agent 這一載體進行智能化升級。 然而,在市場情緒被再次點燃的背後,WorkBuddy 以及一眾桌面 Agent 玩家也面臨着挑戰。 首當其衝的便是 “越權” 與 “隱私” 的博弈。桌面 Agent 的核心價值在於深度訪問用户的電腦系統、文件和應用,這種深度的互動意味着用户必須讓渡極高的系統權限。正如業界對 OpenClaw“24 小時待命賈維斯” 的期待一樣,越是強大的 Agent,其掌握的個人偏好和本地項目數據就越詳盡。 如何在提供便利的同時,確保這些敏感數據不被濫用或在網絡傳輸中泄露,將是 AI Agent 產品必須面對的合規 “生死線”。 騰訊雲 CodeBuddy 團隊告訴華爾街見聞,WorkBuddy 背後依靠 CodeBuddy 的安全保護機制,並通過 “沙盒隔離 + Skill 標準化 + 危險操作攔截” 的多層防禦策略來應對桌面 Agent 的部署挑戰。 其核心思路是:"授權信任並驗證" —— 信任用户指令意圖,通過用户授權驗證執行安全性和危險操作黑名單兜底機制。 此外,Agent 與底座模型之間的 “父子關係” 也決定了其能力的上限與下限。 儘管桌面 Agent 可以通過工程手段優化執行路徑,但 Agent 的基礎能力依然由底層大模型施展。一旦底層模型出現 “幻覺” 或邏輯斷裂,Agent 在自動執行任務中或許也會帶來嚴重後果。 更值得一提的是,桌面 Agent 的興起,本質上是在重構人與計算機的交互關係。過去以來用户是應用之間的 “搬運工”,在瀏覽器、辦公套件和溝通工具間來回穿梭;而隨着 WorkBuddy 這類桌面 Agent 的普及,未來的交互範式可能變為 “以任務為中心”。 當一個 Agent 能夠跨越應用、代表用户完成批量取消郵件訂閲或整理價格差異等複雜任務時,傳統的應用軟件可能會逐漸淪為 Agent 調用的 “技能包”。這意味着,未來的桌面生態競爭,可能不再是軟件功能的堆砌,而是誰的接口更利於 Agent 調用,誰能提供更適配 AI 的操作環境。 從全球範圍來看,桌面 Agent 的競爭才剛剛拉開大幕。不止 Manus、OpenClaw、Claude Cowork 等,還有其它不少同類產品紛紛搶灘上線。 當 AI 真正接管了我們的鼠標和鍵盤,那是效率的極致提升,也是對數字安全底線的全新考驗。隨着 “桌面 Agent 大戰” 的硝煙四起,一場關於生產力範式的變革,已然兵臨城下。