--- title: "AMD 的 AI 總監批評 Claude Code 自上次更新後變得更加愚蠢和懶惰" type: "News" locale: "zh-HK" url: "https://longbridge.com/zh-HK/news/282059306.md" description: "AMD 的人工智能總監 Stella Laurenzo 批評 Claude Code 自二月份以來表現下滑,聲稱其已無法處理複雜任務。對 6,852 次會話的分析顯示,該人工智能的閲讀和推理能力顯著下降,這與 2.1.69 版本的推出相吻合,該版本引入了思維內容的刪減。Laurenzo 呼籲 Anthropic 在思維令牌方面保持透明,並建議為有複雜需求的用户提供分級訂閲模型。她警告稱,如果不進行改進,Anthropic 有失去其在人工智能編碼領域領先地位的風險" datetime: "2026-04-08T14:35:51.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/282059306.md) - [en](https://longbridge.com/en/news/282059306.md) - [zh-HK](https://longbridge.com/zh-HK/news/282059306.md) --- # AMD 的 AI 總監批評 Claude Code 自上次更新後變得更加愚蠢和懶惰 如果你注意到 Claude Code 的表現下降到讓你不再信任它處理複雜任務的地步,你並不是唯一一個。 週五,用户 stellaracc 在 GitHub 上提交了一個問題。該用户的 GitHub 個人資料和相關的 LinkedIn 帖子將發佈者確定為 AMD 芯片製造商的 AI 團隊負責人 Stella Laurenzo。她抱怨説,自從二月份以來,Claude Code 的表現真的很糟糕。 “Claude 無法被信任來執行復雜的工程任務,” Laurenzo 寫道,並指出她的團隊通過參考他們使用 Claude Code 的 “非常一致、高複雜度的工作環境” 中的幾個月日誌得出了這個結論。“我團隊中的每位高級工程師都報告了類似的經歷/軼事,” Laurenzo 補充道。 根據問題線程中的評論,很多其他人也有同樣的感覺,Reddit 評論者表達了類似的情緒。 為了得出這個結論,Laurenzo 和她的團隊分析了 6852 個 Claude Code 會話,涉及 234760 次工具調用和 17871 個思考塊。根據他們的數據,用於捕捉所有權規避、思考過程的過早中止和表明 “懶惰” 的尋求許可行為的停止鈎違規次數激增,從 3 月 8 日之前的零次增加到上個月底的平均每天 10 次。 Claude 在進行更改之前閲讀一段代碼的次數也大幅下降,從平均 6.6 次減少到 3 月底的僅 2 次,而在同一時期,Claude 開始更頻繁地重寫整個文件,而不是進行編輯。 Laurenzo 表示,所有這些跡象都表明 Claude Code 的思考深度下降,並與 Claude Code 版本 2.1.69 在 3 月初部署的思考內容刪除功能相吻合。思考刪除功能作為一個頭部,默認從 Claude Code API 響應中剝離思考內容,這意味着用户無法瞭解 Claude Code 在反思請求時實際上在做什麼。 根據 Lorenzo 的説法,證據表明自實施以來思考深度普遍下降。 “當思考膚淺時,模型默認選擇最便宜的行動:不閲讀就編輯,未完成就停止,逃避失敗的責任,選擇最簡單的修復而不是正確的修復,” GitHub 問題解釋道。“這些正是觀察到的症狀。” 如果你在想,這似乎是一個與 Claude Code 用户在二月份抱怨的另一個問題不同,當時版本 2.1.20 的機器人導致它截斷了其思考過程中的閲讀解釋。 在那個情況下,許多 Claude Code 用户聲稱這是 AI 被簡化的證據,用户只剩下簡短的一行,指示讀取了多少文件,幾乎沒有更多的具體信息。我們無法想象那些開發者會對這一最新發展感到滿意。 Anthropic 也因無法解釋的令牌使用激增而受到批評,這使得一些用户超出了他們的限制,無法使用該產品。再加上 Claude Code 整個源代碼的最近曝光,這對這家 AI 公司來説情況不妙。 對於 Laurenzo 而言,她希望 Anthropic 能夠透明地説明是否在減少或限制思考令牌,並導致 Claude Code 產生無用的信息。至少,她希望 Claude 能夠公開每個請求使用的思考令牌數量,以便讓用户 “監控他們的請求是否獲得所需的推理深度。” Laurenzo 還要求為運行復雜工作流程的工程師在 Anthropic 的產品中增加一個最大思考層級。“當前的訂閲模型並未區分需要每個響應 200 個思考令牌的用户和需要 20000 個的用户,” AMD AI 負責人解釋道。“運行復雜工程工作流程的用户將為保證深度思考支付更多費用。” - Claude Code 源代碼泄露揭示了 Anthropic 可以收集多少關於你和你的系統的信息 - 使用 AI 進行編碼並不意味着你的代碼更安全 - 由於 Claude Code 源代碼泄露,Anthropic 確實面臨麻煩 - Claude Code 的窺探 AI 讀取了禁區的秘密文件 “我們已經切換到另一家提供商,他們的工作質量更高,但 Claude 對我們一直很好,我們希望 Anthropic 能夠修復他們的產品,” Laurenzo 解釋道,同時拒絕在評論中透露她團隊正在使用的任何新工具的細節,理由是保密協議。儘管如此,Laurenzo 確實警告 Anthropic,AI 編碼遊戲仍處於早期階段,如果其行為持續下去,Anthropic 可能會失去領先地位。 “我只想補充的是,六個月前,Claude 在推理質量和執行方面獨佔鰲頭,” Laurenzo 在問題線程的回覆中補充道。“但其他人需要被仔細觀察和評估。Anthropic 在 Opus 之前所佔據的能力層級上遠非孤獨。” Anthropic 和 Laurenzo 最初都沒有對本故事的問題作出回應。® ### 相關股票 - [IGPT.US](https://longbridge.com/zh-HK/quote/IGPT.US.md) - [SMH.US](https://longbridge.com/zh-HK/quote/SMH.US.md) - [AMDD.US](https://longbridge.com/zh-HK/quote/AMDD.US.md) - [AMUU.US](https://longbridge.com/zh-HK/quote/AMUU.US.md) - [PSI.US](https://longbridge.com/zh-HK/quote/PSI.US.md) - [SOXQ.US](https://longbridge.com/zh-HK/quote/SOXQ.US.md) - [SOXX.US](https://longbridge.com/zh-HK/quote/SOXX.US.md) - [AMDL.US](https://longbridge.com/zh-HK/quote/AMDL.US.md) - [XSD.US](https://longbridge.com/zh-HK/quote/XSD.US.md) - [SOXL.US](https://longbridge.com/zh-HK/quote/SOXL.US.md) - [AMD.US](https://longbridge.com/zh-HK/quote/AMD.US.md) ## 相關資訊與研究 - [護國神山法説行情助攻台股創高 這檔科技市值型 ETF 盤中漲 3.5% 同創高](https://longbridge.com/zh-HK/news/282625605.md) - [Sandisk 佈局 HBF 新世代記憶體 試產線下半年啟動、目標 2027 年商用化](https://longbridge.com/zh-HK/news/282523957.md) - [南亞科四大廠私募資金到位 不排除再與大廠合作強化 AI 佈局](https://longbridge.com/zh-HK/news/282501385.md) - [SK 電信聯手 Arm 與 Rebellions 打造更高效 AI 伺服器,搶攻 AI 基建市場](https://longbridge.com/zh-HK/news/282473570.md) - [台股 ETF「4 月除息高峰秀」來了 六檔除息台股 ETF 4 月來掀搶買潮](https://longbridge.com/zh-HK/news/282560506.md)