抢在 GPT-5 前升级模型,Anthropic 发布 Opus 4.1,编程、研究、数据分析更强大

华尔街见闻
2025.08.05 16:32
portai
我是 PortAI,我可以总结文章信息。

Anthropic 称,在 SWE-Bench Verified 测试中,Opus 4.1 准确率 74.5%,高于 Opus 4 的 72.5%;新模型还提升了 Claude 的深入研究和数据分析能力,尤其是细节追踪和代理搜索方面。此次升级标志着公司战略转向更频繁的渐进式改进,而非仅专注重大版本更新。该司计划,未来几周内发布更重大的模型更新。

人工智能(AI)模型的竞赛再度升温。在 OpenAI 即将发布备受期待的 GPT-5 之际,Anthropic 率先升级自家模型,推出 Claude Opus 4.1,声称在编程、研究和数据分析能力方面实现显著提升。

美东时间 8 月 5 日周二,由前 OpenAI 员工创立的 OpenAI 劲敌 Anthropic 宣布,新模型 Opus 4.1 在编程评估基准 SWE-Bench Verified 上的得分达到 74.5%,较前代 Opus 4 的 72.5% 提升两个百分点。

新模型在处理大型代码库导航和多文件代码重构方面表现尤为突出。GitHub、Rakuten Group 等客户反馈显示,Opus 4.1 在代码修改精准度和调试效率方面均有显著改善,能够在不引入漏洞的情况下精确定位需要修正的代码位置。

面对 OpenAI 本月可能发布 GPT-5 的竞争压力,Anthropic 选择聚焦现有产品优化。

Anthropic 的首席产品官 Mike Krieger 表示,此次 Opus 模型升级标志着公司战略转向更频繁的渐进式改进,而非仅专注重大版本更新。他说:

“过去,我们过于专注于只提供重要的升级。(模型)它现在在编码、推理和代理任务方面都更胜一筹。我们只是想让它更好地服务于人类。”

性能提升聚焦编程领域

Anthropic 公布的数据显示,Opus 4.1 在编程能力方面实现了实质性突破。

Anthropic 公布,在评估大语言模型(LLM)完成现实世界软件工程能力的 SWE-Bench Verified 基准测试中,Opus 4.1 取得 74.5% 的准确率。这一成绩相比 Claude Sonnet 3.7 的 62.3% 和 Opus 4 的 72.5% 有明显进步。

Anthropic 强调,升级后的 Opus 模型在处理复杂多步骤问题时更加高效,定位为更有效的 AI 代理。新模型能够更好地导航大型代码库,在代码修改时更加精确。

Opus 4.1 还 “提升了 Claude 的深入研究和数据分析能力,尤其是在细节追踪和代理搜索方面。”

Anthropic 本周二表示,被 Cognition 收购的 AI 编程助手 Windsurf 反馈称,Opus 4.1 在其初级开发人员基准测试中较 Opus 4 有一个标准差的改进,性能提升幅度相当于从 Sonnet 3.7 跃升至 Sonnet 4 的水平。

客户反馈验证实用价值

Anthropic 本周二提到一些企业客户的使用反馈,它们证实了新模型的实际改进效果。

比如日本电商巨头乐天集团(Rakuten Group)发现,Opus 4.1 擅长在大型代码库中精确定位需要修正的位置,无需进行不必要的调整或引入漏洞,乐天的团队倾向于利用该模型的这种精确性处理日常调试任务。

Windsurf 表示,使用 Opus 4.1 后编程任务完成速度更快,质量也有所提高。GitHub 则指出,Opus 4.1 相对于 Opus 4 在大多数功能上都有改进,在多文件代码重构方面的性能提升尤为显著。

市场竞争加剧背景下的战略调整

Anthropic 此次发布正值 AI 行业竞争白热化之际。谷歌和 OpenAI 都推出了帮助程序员简化代码编写和调试流程的功能,而 OpenAI 高管也在公开场合为即将发布的 GPT-5 造势,有报道称该产品可能在本月推出。

被问及 OpenAI 即将发布的产品时,Mike Krieger 表示:"我学到的一点是,我们要专注于自己拥有的东西,尤其是在快速发展的 AI 领域,其他人要做什么最终取决于他们自己。"

Anthropic 本周二表示,Opus 4.1 现已向付费 Claude 用户开放,并可通过 Anthropic 的 API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 获得,定价与 Opus 4 保持一致。Anthropic 还计划,未来几周内发布更重大的模型更新。

Anthropic 被传新融资或推升估值至 1700 亿美元

将近两周前,7 月中旬媒体称,Anthropic 称其年化收入今年上半年增长四倍,已超过 40 亿美元,其爆炸式的收入增长引起部分投资者浓厚兴趣,考虑以超过 1000 亿美元的估值进行新一轮投资,较四个月前该司宣布融资时的 580 亿美元估值几乎翻了一番。

此后,有媒体在与多位中东投资者交流后表示,Anthropic 即将到来的估值更接近 1500 亿美元。

上周又有媒体称,Anthropic 正进行 Iconiq Capital 主导的新一轮融资相关磋商,拟融资 30 亿至 50 亿美元,使公司估值达到 1700 亿美元。另有媒体称,到 7 月末,Anthropic 的年化收入已增至约 50 亿美元。该司预计,到今年年底,其经常性收入可能达到 90 亿美元。

Anthropic 的新融资消息凸显了市场对头部 AI 公司未来增长的极高预期,尤其是对 Anthropic 在 AI 编码这一应用领域的强大变现能力方面。