智譜交出 AI Agent 最新答卷

華爾街見聞
2024.12.02 09:43
portai
我是 PortAI,我可以總結文章信息。

作者 | 劉寶丹

編輯 | 黃昱

距離 ChatGPT 橫空出世已有兩年,AI 大模型技術迎來了新的發展階段,AI Agent 成為行業競爭的新焦點,國內 AI 獨角獸智譜也率先披露了 Agent 技術方面的佈局。

11 月 29 日,在智譜 Agent OpenDay 上,公司 CEO 張鵬發佈了 AutoGLM 升級版。這一版本不僅能夠執行超過 50 步的複雜操作流程,跨越不同應用程序執行任務,還能支持長任務的自定義短語,並具備主動決策的能力。

此外,智譜 AI 還推出了基於 PC 的自主 Agent——GLM-PC,它的定位是成為一個全面的桌面助手,目前涵蓋會議替身、文檔處理、網頁搜索與總結等功能。

此次升級標誌着,智譜 AI 在語言交互的基礎上,進一步推動大模型技術向更復雜的物理世界交互邁進。

智譜創立於 2019 年,由清華大學計算機系知識工程實驗室的技術成果轉化而來,是 “AI 六小虎” 中成立最早的 AI 創業公司。在 ChatGPT 走紅的前兩年,智譜 AI 便已全力投入大模型技術的研發,目前已經成為 AI 技術佈局最為完備的公司之一。

AutoGLM 能快速推出,也是得益於智譜的前瞻性技術佈局,包括智譜在大語言模型、多模態模型、邏輯推理和工具使用等方面的技術積累。

張鵬表示,從 2023 年 4 月的 Agent Bench 開始,到 2023 年 8 月的 CogAgent 模型,智譜針對 AutoGLM,和 GLM-PC 的模型 CogAgent 的研發工作進行了一年半的時間。

對智譜而言,AutoGLM 和 GLM-PC 是公司邁向 AI 智能操作系統的重要一步,更是通向 AGI 的必由之路。

與 GenAI 不同,Agent 是目標驅動型的,能夠完全執行工作流程,適應、學習、迭代、與其他系統和人類協作,並端到端的完成任務。張鵬認為,Agent 可以視為大模型通用操作系統 LLM-OS 的雛形。

張鵬表示,“現階段,AutoGLM 相當於在人與應用之間添加一個執行的調度層,很大程度上改變人機的交互形式。更重要的是,我們看到了 LLM-OS 的可能,基於大模型智能能力,未來有機會實現原生的人機交互。將人機交互範式帶向新的階段。”

業內普遍認為,2025 年將是 Agent 爆發之年。Gartner 近期將 agentic AI 列為 2025 年十大技術趨勢之一,並預測 2028 年至少有 15% 的日常工作決策將由 agentic AI 自主完成,而這一數字在 2024 年為 0。

業界領袖如黃仁勳、李彥宏、奧特曼等都公開表示看好其未來發展。黃仁勳認為,AI Agents 是人工智能發展的未來趨勢,世界各地都在競相採用人工智能來加速創新和提高生產力,很快,公司將有 AI Agents 和團隊一起工作。

根據 marketsandmarkets 的數據顯示,2019 年全球自主智能體市場份額為 3.45 億美元,預計 2024 年將達到 29.92 億美元,其間 CAGR 為 54%。該機構預測,2023 年全球自主人工智能和自主智能體的市場規模在 2028 年能達到 285 億美元,其間 CAGR 為 43%。

對智譜而言,提前佈局 AI Agent 贏得了寶貴的時間優勢,這對於一個處於快速技術迭代的行業來説至關重要。然而,AI Agent 仍處於早期階段,智譜 AI 面臨的競爭壓力不容小覷。

張鵬坦言,目前大模型的能力距離真正代替人們辦公還有一定距離。未來,GLM 團隊將繼續加速 Agent 模型產品的研發。

挑戰也顯而易見,全球巨頭們都開始加註 AI Agent。6 月,蘋果在開發者大會上展示了其最新的 AI 成果 Apple Intelligence,Anthropic(Computer Use)、谷歌(Jarvis)和 OpenAI(Operator)等企業也已經將 Agent 作為 2025 年的主要關注點。

下半年以來,投資人對 AI 大模型行業的投資熱情已經顯著下降,AI 創業公司普遍面臨商業化方面的壓力。對此,張鵬表示,商業化固然重要,但並非唯一目標,智譜 AI 希望在技術投入和商業化之間找到平衡。

張鵬強調:“我們看待問題更多的是技術導向,是最終目的的導向,而不是僅侷限於單項技術的快速變現。我們最終是幫助大家切切實實解決生產力問題,而不僅僅是簡單的快速盈利。”

根據 IT 桔子數據,智譜成立以來累計完成 10 輪融資,目前估值為 260 億元,僅今年,公司就經歷了 4 輪融資,背後的投資者既包括阿里、騰訊這樣的大廠,也包括紅杉、高瓴等資本機構,北京人工智能產業基金、清華控股、中關村科學城也是智譜的股東。

AutoGLM 只是一個開始,在經過了 5 年多的技術沉澱後,智譜開始真正邁向大規模應用階段,雖然離用一句話操作電腦和手機的範式還有很遠距離,但探索之路已經開始了。