
Claude 4 要來了?Anthropic 發佈 38 頁經濟指數報告,43% 人類工作正被 AI 取代!

Anthropic 即將發佈 Claude 4,並推出 38 頁的「Anthropic 經濟指數」報告,分析 AI 對人類工作的影響。報告指出,AI 將自動化 43% 的工作,主要集中在軟件開發和寫作任務上。AI 的使用在中高收入工作中最為普遍,57% 的使用增強人類能力,43% 則取代人類勞動。該報告基於 Claude.ai 平台的數百萬條匿名對話數據,提供了 AI 在現代經濟中的應用分析。
Claude 3.5 Opus 無了,Anthropic 本週可能會提前放出 Claude 4。
網友爆料稱,除了 Claude 4,還有推理模型也將首亮相,評分全面超越 o3。

Anthropic 已經沉寂太久了,去年曾被傳出內部模型研發受阻。
不久前,或許因為 DeepSeek 的衝擊,OpenAI、谷歌密集上新了新模型全家桶。
這次 Anthropic 要直接來一波大的:評分超越「滿血」o3,那可是目前公認的比 DeepSeek-R1 強的對手!
同一天,他們還發布了「Anthropic 經濟指數」報告,全文 38 頁全面分析了數百萬匿名 Claude 對話,從中揭示了 AI 在各個職業的應用現狀。

Anthropic 認為在未來幾年,AI 對人們的工作將產生重大影響,最新報告旨在長期追蹤 AI 對勞動力市場和經濟的影響。

AI 將自動化 43% 工作
在這篇報告中,Anthropic 從任務類型、使用深度、職業技能、收入水平等角度,討論了 AI 對不同職業不同羣體的影響。
主要結論如下:
-
AI 的使用主要集中在軟件開發和寫作任務上,這兩者佔總使用量的近 50%。
-
AI 的使用範圍更廣泛,約有 36% 的職業在至少四分之一的相關任務中使用 AI;在中等至高收入的工作中使用最為普遍。
-
在各類任務中,57% 的使用表明 AI 在增強人類能力,而 43% 的使用表明在取代人類勞動,即工作自動化。
更值得一提的是,Cluade 編碼和數學佔所有使用量 1/3(37.2%)。

為什麼發佈「經濟指數」?
基於 Claude.ai 平台上數百萬條匿名對話數據,該指數的首份報告提供了前所未有的分析和洞察,揭示在現代經濟的各類任務中,如何實際應用 AI。
迄今為止,這是關於 AI 融入現實經濟活動的最清晰圖景。
為了推動更廣泛的研究,Anthropic 決定開源本次分析所使用的數據集,供研究人員在此基礎上進一步探索和擴展。

面對勞動力市場即將到來的轉型及其對就業和生產力的影響,制定有效的政策措施需要多方視角,統籌兼顧。
因此,Anthropic 誠摯邀請經濟學家、政策專家及其他研究人員提供寶貴意見。
數據分析方法:將對話和職業關聯
新論文基於對技術影響勞動力市場的長期研究,從工業革命時期的珍妮紡紗機到當今的汽車製造機器人。
關注 AI(AI)的持續影響。新研究不調查人們的 AI 使用情況,也不嘗試預測未來;相反,直接獲取了 AI 實際使用的數據。
分析職業任務
新研究始於經濟學文獻中的重要洞見:有時候,關注職業任務而非職業本身,也有意義。
工作通常共享某些任務和技能:例如,視覺模式識別是設計師、攝影師、安檢員和放射科醫生共同完成的任務。
某些任務比其他任務更適合被新技術自動化或增強。
因此,預計 AI 會在不同職業中有選擇地被採用,分析任務(而不僅僅是整體工作)將提供一個更全面的圖景,展示 AI 如何融入經濟。
使用 Clio 匹配 AI 使用與任務
這項研究得以實現,依靠的是 Clio 系統。在保護用户隱私的同時,它可以分析與 Claude 的對話。
新研究分析了約一百萬次與 Claude 的對話(包括 Free 和 Pro 版本的對話),並按職業任務對對話進行分類。
美國勞工部維護着一個包含約 20,000 項具體工作任務的數據庫,稱為職業信息網絡(O*NET)。

根據美國勞工部的分類選擇任務,Clio 將每次對話與最能代表對話中 AI 角色的 O*NET 任務進行匹配。
Clio 系統將與 Claude 的對話(嚴格保密,位於下圖頂部左側)轉化為職業任務(下圖頂部中間),並進一步映射到 O*NET 提供的職業/職業類別(頂部右側)。
隨後,這些數據可以輸入到多種分析中(下圖底部一行)。
最後,按照 O*NET 的分類方案,將任務分組到它們最能代表的職業中,並將職業分組到一小組總體類別中:教育和圖書館、商業和金融等。
算法流程總結
具體結果
對不同職業影響
採用 AI 最多的任務和職業是「計算機與數學」類別,主要涵蓋了軟件工程角色。
37.2% 的 Claude 查詢屬於這一類別,涉及的任務包括軟件修改、代碼調試和網絡故障排除。
第二大類別是「藝術、設計、體育、娛樂和媒體」(10.3% 的查詢),主要反映了使用 Claude 進行各種寫作和編輯任務。
不出所料,涉及大量體力勞動的職業,如「農業、漁業和林業」類別(0.1% 的查詢),在數據中表現最少。
新研究還將數據中的比例與各職業在整體勞動力市場中的出現率進行了比較,詳細結果如下圖所示。

職業內部 AI 使用程度
分析發現,在工作中 AI 的重度用户集中在極少數職業:僅約 4% 的職業在至少 75% 的任務中使用 AI。
AI 的中等使用率更為普遍:大約 36% 的職業,在至少 25% 的任務中一定程度地使用 AI。
AI 在經濟中的應用分佈:基於 Claude.ai 的真實使用數據。數據中的百分比表示與 Claude 的對話中涉及特定任務、職業及類別的比例。
AI 在經濟中的應用分佈:基於 Claude.ai 的真實使用數據。數據中的百分比表示與 Claude 的對話中涉及特定任務、職業及類別的比例
正如預測的那樣,數據中沒有證據表明職業被完全自動化:相反,AI 在經濟中的許多任務中得到了廣泛應用,對某些任務羣體的影響比其他任務羣體更大。
AI 使用與薪資
O*NET 數據庫提供了各個職業在美國的中位薪資。
研究者將這一信息加入分析,從而比較不同職業的中位薪資與其任務中 AI 使用水平之間的關係。
有趣的是,低薪職業和高薪職業的 AI 使用率都較低(這些職業通常涉及大量手工操作,例如洗髮師和產科醫生)。
而 AI 使用最廣泛的職業主要集中在中等至較高薪資範圍內,例如計算機程序員和文案撰寫人。

年薪(x 軸)與涉及該職業的對話百分比(y 軸)的關係。一些具有代表性的職業被突出顯示
自動化 vs.增強
研究者還更詳細地分析了任務的執行方式。
他們關注了哪些任務屬於「自動化」(即 AI 直接執行任務,如格式化文檔),以及哪些任務屬於「增強」(即 AI 與用户協作完成任務)。
總體來看,AI 在任務執行上更傾向於增強模式,57% 的任務屬於增強,43% 的任務屬於自動化。
也就是説,在超過一半的情況下,AI 並未取代人類完成任務,而是與人類協作,參與諸如驗證(例如核對用户的工作)、學習(例如幫助用户獲取新知識和技能)以及任務迭代(例如幫助用户進行頭腦風暴或執行重複的生成性任務)等工作。

Claude 對話中涉及增強與自動化的比例,以及每個類別內任務子類型的分解
38 頁報告中,還覆蓋了其他一些有趣的數據。
下圖 4 中展示了不同職業中,人工智能使用深度的分析。約 36% 的職業至少在 25% 的任務中使用 AI,僅約 4% 的職業在 75% 或更多的任務中使用 AI。
這表明了,在大多數職業中,人工智能的整合仍然是選擇性的,而非全面性的。

圖 5 展示的是,與 Claude 對話用户職業技能的分佈。
批判性思維、寫作、編程等技能在對話中出現頻率較高,而設備維護、安裝等手工技能則較為罕見。

圖 8 所展示的是,Claude Sonnet 3.5(新版)和 Claude Opus 模型之間任務使用模式的比較分析,展示了人們偏好差異。
前者在編碼和技術任務方面表現出更多的使用量,而後者則更多用於創意寫作和教育內容開發。

任務層級使用狀況
如上所述,研究人員用 Clio 創建了一個任務層級體系,將對話匹配到最適合的 O*NET 任務。
在頂層(圖 11),可以看到:
-
IT、技術及相關任務占主導地位(對話量佔比近 50%)
-
第二層是創意和文化工作,與藝術、文化和宗教文物創作和保護相關的任務(約佔 20%)
-
商業管理、金融和客户服務運營構成第三大類別(約佔 5%)
-
其餘類別各自佔比均不超過 15%
-
醫療服務和環境系統的代表性較低,各自佔比不到 5%

在中層級(圖 12),數據揭示了更細化的任務模式:
-
軟件開發和網站維護是最普遍的活動(約佔 14%)
-
計算機系統編程和調試緊隨其後(約佔 11%)
-
系統管理、硬件/軟件故障排除和文檔發佈流程(各佔 4-6%)
-
市場營銷/推廣策略、網絡優化、學術輔導和公關管理雖然出現,但頻率較低(各約佔 2-3%)
-
數據科學和機器學習應用(約佔 2%)

在基礎層級(圖 13),可以看到高度具體的技術操作:
-
軟件修改和錯誤修正活動占主導地位,其中以適應新硬件或改進性能為重點的任務出現最頻繁
-
初始調試程序、系統管理和硬件/軟件故障排除是下一組最常見的活動
-
文檔編輯和程序分析任務出現頻率較低,但仍構成對話的重要部分

注意!
新研究提供 AI 如何改變勞動力市場的獨特視角。
然而,與所有研究一樣,它也存在重要的侷限性。以下是一些主要的注意事項:
-
任務用途不明確:無法確定使用 Claude 完成任務的人是否是為了工作。例如,向 Claude 尋求寫作或編輯建議的人可能是為了工作,也可能是為了業餘寫作的小説。
-
響應使用方式不明確:不知道用户如何使用 Claude 的響應。例如,他們是否複製粘貼代碼片段?他們是否核實響應還是不加批判地接受?
-
數據來源有限:僅分析了 Claude.ai 免費和專業版的數據,而非 API、團隊或企業用户的數據。
-
任務分類誤差:由於任務種類繁多,Clio 可能會錯誤分類一些對話。
-
創意用途未涵蓋:Claude 無法生成圖像(除通過代碼間接生成外),因此創意用途在數據中未被引用。
-
編碼用例可能過度代表:由於 Claude 被宣傳為用於編碼的頂尖模型,編碼用例可能在數據中被過度代表。因此,我們不認為數據集中的用例代表了人工智能的普遍使用情況。
結論與未來
人工智能的使用正在迅速擴展,模型的能力也在不斷提升。勞動力市場的面貌可能在短時間內發生顯著變化。
因此,Anthropic 將不斷重複上述分析,以幫助跟蹤可能發生的社會和經濟變化,並定期發佈結果和相關數據集。
這種縱向分析可以為提供關於 AI 和就業市場的新見解。
例如,可以監測職業內部 AI 使用深度的變化。如果人工智能僅用於特定任務,且只有少數職業在大多數任務中使用人工智能,那麼未來可能是大多數現有職業演變而非消失。
還可以監測自動化與增強的比例,瞭解自動化在哪些領域變得更為普遍。
注意新研究只是對 AI 模型 Claude 的對話數據分析,並沒有提供政策建議。
如何做好為 AI 對勞動力市場的影響的準備,不能僅從研究中直接得出,而是需要結合證據、價值觀和廣泛的經驗。
新智元,原文標題:《Claude 4 要來了?Anthropic 發佈 38 頁經濟指數報告,43% 人類工作正被 AI 取代!》
風險提示及免責條款
市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。

