<p>人工智能（AI）模型的竞赛再度升温。在 OpenAI 即将发布备受期待的 GPT-5 之际，Anthropic 率先升级自家模型，推出 Claude Opus 4.1，声称在编程、研究和数据分析能力方面实现显著提升。</p>
<p>美东时间 8 月 5 日周二，由前 OpenAI 员工创立的 OpenAI 劲敌 Anthropic 宣布，新模型 Opus 4.1 在编程评估基准 SWE-Bench Verified 上的得分达到 74.5%，较前代 Opus 4 的 72.5% 提升两个百分点。</p>
<p>新模型在处理大型代码库导航和多文件代码重构方面表现尤为突出。GitHub、Rakuten Group 等客户反馈显示，Opus 4.1 在代码修改精准度和调试效率方面均有显著改善，能够在不引入漏洞的情况下精确定位需要修正的代码位置。</p>
<p>面对 OpenAI 本月可能发布 GPT-5 的竞争压力，Anthropic 选择聚焦现有产品优化。</p>
<p>Anthropic 的首席产品官 Mike Krieger 表示，此次 Opus 模型升级标志着公司战略转向更频繁的渐进式改进，而非仅专注重大版本更新。他说：</p>
<blockquote>
<p>“过去，我们过于专注于只提供重要的升级。（模型）它现在在编码、推理和代理任务方面都更胜一筹。我们只是想让它更好地服务于人类。”</p>
</blockquote>
<div>
<h2 id="43a77674">性能提升聚焦编程领域</h2>
</div>
<p>Anthropic 公布的数据显示，Opus 4.1 在编程能力方面实现了实质性突破。</p>
<p>Anthropic 公布，在评估大语言模型（LLM）完成现实世界软件工程能力的 SWE-Bench Verified 基准测试中，Opus 4.1 取得 74.5% 的准确率。这一成绩相比 Claude Sonnet 3.7 的 62.3% 和 Opus 4 的 72.5% 有明显进步。</p>
<p><img src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/dac5f699-a2d2-497e-b85c-41a737ad9d57.jpeg?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="2560" height="1440" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/dac5f699-a2d2-497e-b85c-41a737ad9d57.jpeg"/></p>
<p>Anthropic 强调，升级后的 Opus 模型在处理复杂多步骤问题时更加高效，定位为更有效的 AI 代理。新模型能够更好地导航大型代码库，在代码修改时更加精确。</p>
<blockquote>
<p>Opus 4.1 还 “提升了 Claude 的深入研究和数据分析能力，尤其是在细节追踪和代理搜索方面。”</p>
</blockquote>
<p>Anthropic 本周二表示，被 Cognition 收购的 AI 编程助手 Windsurf 反馈称，Opus 4.1 在其初级开发人员基准测试中较 Opus 4 有一个标准差的改进，性能提升幅度相当于从 Sonnet 3.7 跃升至 Sonnet 4 的水平。</p>
<div>
<h2 id="4cdb065a">客户反馈验证实用价值</h2>
</div>
<p>Anthropic 本周二提到一些企业客户的使用反馈，它们证实了新模型的实际改进效果。</p>
<p>比如日本电商巨头乐天集团（Rakuten Group）发现，Opus 4.1 擅长在大型代码库中精确定位需要修正的位置，无需进行不必要的调整或引入漏洞，乐天的团队倾向于利用该模型的这种精确性处理日常调试任务。</p>
<p>Windsurf 表示，使用 Opus 4.1 后编程任务完成速度更快，质量也有所提高。GitHub 则指出，Opus 4.1 相对于 Opus 4 在大多数功能上都有改进，在多文件代码重构方面的性能提升尤为显著。</p>
<div>
<h2 id="5a6c9714">市场竞争加剧背景下的战略调整</h2>
</div>
<p>Anthropic 此次发布正值 AI 行业竞争白热化之际。谷歌和 OpenAI 都推出了帮助程序员简化代码编写和调试流程的功能，而 OpenAI 高管也在公开场合为即将发布的 GPT-5 造势，有报道称该产品可能在本月推出。</p>
<p>被问及 OpenAI 即将发布的产品时，Mike Krieger 表示：&#34;我学到的一点是，我们要专注于自己拥有的东西，尤其是在快速发展的 AI 领域，其他人要做什么最终取决于他们自己。&#34;</p>
<p>Anthropic 本周二表示，Opus 4.1 现已向付费 Claude 用户开放，并可通过 Anthropic 的 API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 获得，定价与 Opus 4 保持一致。Anthropic 还计划，未来几周内发布更重大的模型更新。</p>
<h2>Anthropic 被传新融资或推升估值至 1700 亿美元</h2>
<p>将近两周前，7 月中旬媒体称，Anthropic 称其年化收入今年上半年增长四倍，已超过 40 亿美元，其爆炸式的收入增长引起部分投资者浓厚兴趣，考虑以超过 1000 亿美元的估值进行新一轮投资，较四个月前该司宣布融资时的 580 亿美元估值几乎翻了一番。</p>
<p>此后，有媒体在与多位中东投资者交流后表示，Anthropic 即将到来的估值更接近 1500 亿美元。</p>
<p>上周又有媒体称，Anthropic 正进行 Iconiq Capital 主导的新一轮融资相关磋商，拟融资 30 亿至 50 亿美元，使公司估值达到 1700 亿美元。另有媒体称，到 7 月末，Anthropic 的年化收入已增至约 50 亿美元。该司预计，到今年年底，其经常性收入可能达到 90 亿美元。</p>
<p>Anthropic 的新融资消息凸显了市场对头部 AI 公司未来增长的极高预期，尤其是对 Anthropic 在 AI 编码这一应用领域的强大变现能力方面。</p>

谷歌-A

谷歌-C

OpenAI

<p>Anthropic 称，在 SWE-Bench Verified 测试中，Opus 4.1 准确率 74.5%，高于 Opus 4 的 72.5%；新模型还提升了 Claude 的深入研究和数据分析能力，尤其是细节追踪和代理搜索方面。此次升级标志着公司战略转向更频繁的渐进式改进，而非仅专注重大版本更新。该司计划，未来几周内发布更重大的模型更新。</p>

- Anthropic 发布新模型 Opus 4.1，编程能力得分达 74.5%。
- 客户反馈显示，Opus 4.1 在代码修改和调试效率上显著提升。
- 公司估值可能达到 1700 亿美元，年化收入预计增至 90 亿美元。

抢在 GPT-5 前升级模型，Anthropic 发布 Opus 4.1，编程、研究、数据分析更强大