---
title: "短短几分钟，AI 轻松通过了 CFA 三级考试"
description: "最新研究显示，多个 AI 模型已能在几分钟内通过享有盛誉的 CFA 三级考试，而人类通常需要数年学习。其中 Gemini 2.5 Pro 综合表现最佳，国产 KIMI K2 在多选题正确率达 78.3%。尽管 AI 考试表现出色，但专家认为在情境理解等方面仍难以完全替代人类金融专业人士。"
type: "news"
locale: "zh-CN"
url: "https://longbridge.com/zh-CN/news/258796277.md"
published_at: "2025-09-25T03:34:12.000Z"
---

# 短短几分钟，AI 轻松通过了 CFA 三级考试

> 最新研究显示，多个 AI 模型已能在几分钟内通过享有盛誉的 CFA 三级考试，而人类通常需要数年学习。其中 Gemini 2.5 Pro 综合表现最佳，国产 KIMI K2 在多选题正确率达 78.3%。尽管 AI 考试表现出色，但专家认为在情境理解等方面仍难以完全替代人类金融专业人士。

最新研究显示，多个 AI 模型已能在几分钟内通过享有盛誉的 CFA 三级考试，而人类通常需要数年时间和约 1000 小时学习才能完成。

纽约大学斯特恩商学院和 AI 财富管理平台 GoodFin 的研究人员测试了 23 个大型语言模型，发现包括 o4-mini、Gemini 2.5 Pro 和 Claude Opus 在内的前沿推理模型能够成功通过 CFA 三级模拟考试。

这些模型采用"思维链提示"技术，有效应对了此前令 AI 头疼的论文题型。GoodFin 创始人兼首席执行官 Anna Joo Fee 表示：

> 我认为这项技术绝对有未来改变整个行业的可能。

## AI 模型全面突破 CFA 三级考试壁垒

两年前的研究曾发现，AI 模型能够通过 CFA 一级和二级考试，但在三级考试的论述题环节遭遇重大障碍。

最新研究证实，AI 技术的快速发展已经克服了这一关键瓶颈。

研究团队对 23 个大型语言模型进行了全面测试，特别关注 AI 模型是否具备"专业金融决策所需的专业化、高风险分析推理能力"，以此评估其在 CFA 三级模拟考试中处理选择题和论文题的能力。

研究结果表明，在处理复杂金融问题时，推理模型的表现显著优于传统的非推理模型。特别是采用"思维链提示"技术的前沿推理模型成功通过了相关考试测试。

**其中 Gemini 2.5 Pro 在论述题评分中获得 3.44 分的最高成绩，同时在综合表现（选择题和论述题）中以 2.1 分位居榜首。**

**值得注意的是，国产的 KIMI K2 模型在多选题中表现最佳，正确率高达 78.3%，超过谷歌的 Gemini 2.5 Pro 和 GPT-5。**

研究采用了零样本、自我一致性和自我发现三种提示策略，其中自我一致性策略取得 73.4% 的最佳表现评分。

在成本效益分析中，Llama 3.1 8B Instant 获得 5468 的最佳成本效率评分，而 Palmyra Fin 以 0.3 秒的平均响应时间成为速度最快的模型。

尽管 AI 在标准化考试中表现出色，但业内专家认为完全替代人类金融专业人士仍存在局限。Fee 强调：

> 诸如情境理解和意图判断等方面，机器目前还难以准确评估。这正是人类的优势所在，能够理解客户的肢体语言和各种暗示。

### Related Stocks

- [OpenAI.NA - OpenAI](https://longbridge.com/zh-CN/quote/OpenAI.NA.md)
- [AI.US - C3.ai](https://longbridge.com/zh-CN/quote/AI.US.md)
- [GEMI.US - Gemini Space Station](https://longbridge.com/zh-CN/quote/GEMI.US.md)

## Related News & Research

| Title | Description | URL |
|-------|-------------|-----|
| Indian AI lab Sarvam’s new models are a major bet on the viability of open-source AI | Indian AI lab Sarvam has launched new large language models, betting on open-source AI to compete with larger rivals. An | [Link](https://longbridge.com/zh-CN/news/276230007.md) |
| BrandPilot AI Launches ClickRadar(TM), Targeting $63Billion[1] Bot Epidemic Problem | BrandPilot AI Inc. has launched ClickRadar™, a real-time bot detection technology aimed at addressing the $63 billion is | [Link](https://longbridge.com/zh-CN/news/276342971.md) |
| Infosys Unveils AI First Value Framework | Infosys Ltd :INFOSYS - INFOSYS UNVEILS AI FIRST VALUE FRAMEWORK | [Link](https://longbridge.com/zh-CN/news/276131501.md) |
| India’s bold 2026 AI summit calls for inclusive global tech growth | India is hosting the India AI Impact Summit 2026 at Bharat Mandapam from February 16 to 20, marking a significant event  | [Link](https://longbridge.com/zh-CN/news/276009891.md) |
| Sony Targets AI Music Attribution With New Detection Tool | Sony Targets AI Music Attribution With New Detection Tool | [Link](https://longbridge.com/zh-CN/news/276022057.md) |

---

> **免责声明**：本文内容仅供参考，不构成任何投资建议。