---
title: "短短几分鐘，AI 輕鬆通過了 CFA 三級考試"
description: "最新研究顯示，多個 AI 模型已能在幾分鐘內通過享有盛譽的 CFA 三級考試，而人類通常需要數年學習。其中 Gemini 2.5 Pro 綜合表現最佳，國產 KIMI K2 在多選題正確率達 78.3%。儘管 AI 考試表現出色，但專家認為在情境理解等方面仍難以完全替代人類金融專業人士。"
type: "news"
locale: "zh-HK"
url: "https://longbridge.com/zh-HK/news/258796277.md"
published_at: "2025-09-25T03:34:12.000Z"
---

# 短短几分鐘，AI 輕鬆通過了 CFA 三級考試

> 最新研究顯示，多個 AI 模型已能在幾分鐘內通過享有盛譽的 CFA 三級考試，而人類通常需要數年學習。其中 Gemini 2.5 Pro 綜合表現最佳，國產 KIMI K2 在多選題正確率達 78.3%。儘管 AI 考試表現出色，但專家認為在情境理解等方面仍難以完全替代人類金融專業人士。

最新研究顯示，多個 AI 模型已能在幾分鐘內通過享有盛譽的 CFA 三級考試，而人類通常需要數年時間和約 1000 小時學習才能完成。

紐約大學斯特恩商學院和 AI 財富管理平台 GoodFin 的研究人員測試了 23 個大型語言模型，發現包括 o4-mini、Gemini 2.5 Pro 和 Claude Opus 在內的前沿推理模型能夠成功通過 CFA 三級模擬考試。

這些模型採用"思維鏈提示"技術，有效應對了此前令 AI 頭疼的論文題型。GoodFin 創始人兼首席執行官 Anna Joo Fee 表示：

> 我認為這項技術絕對有未來改變整個行業的可能。

## AI 模型全面突破 CFA 三級考試壁壘

兩年前的研究曾發現，AI 模型能夠通過 CFA 一級和二級考試，但在三級考試的論述題環節遭遇重大障礙。

最新研究證實，AI 技術的快速發展已經克服了這一關鍵瓶頸。

研究團隊對 23 個大型語言模型進行了全面測試，特別關注 AI 模型是否具備"專業金融決策所需的專業化、高風險分析推理能力"，以此評估其在 CFA 三級模擬考試中處理選擇題和論文題的能力。

研究結果表明，在處理複雜金融問題時，推理模型的表現顯著優於傳統的非推理模型。特別是採用"思維鏈提示"技術的前沿推理模型成功通過了相關考試測試。

**其中 Gemini 2.5 Pro 在論述題評分中獲得 3.44 分的最高成績，同時在綜合表現（選擇題和論述題）中以 2.1 分位居榜首。**

**值得注意的是，國產的 KIMI K2 模型在多選題中表現最佳，正確率高達 78.3%，超過谷歌的 Gemini 2.5 Pro 和 GPT-5。**

研究採用了零樣本、自我一致性和自我發現三種提示策略，其中自我一致性策略取得 73.4% 的最佳表現評分。

在成本效益分析中，Llama 3.1 8B Instant 獲得 5468 的最佳成本效率評分，而 Palmyra Fin 以 0.3 秒的平均響應時間成為速度最快的模型。

儘管 AI 在標準化考試中表現出色，但業內專家認為完全替代人類金融專業人士仍存在侷限。Fee 強調：

> 諸如情境理解和意圖判斷等方面，機器目前還難以準確評估。這正是人類的優勢所在，能夠理解客户的肢體語言和各種暗示。

### Related Stocks

- [OpenAI.NA - OpenAI](https://longbridge.com/zh-HK/quote/OpenAI.NA.md)
- [AI.US - C3.ai](https://longbridge.com/zh-HK/quote/AI.US.md)
- [GEMI.US - Gemini Space Station](https://longbridge.com/zh-HK/quote/GEMI.US.md)

## Related News & Research

| Title | Description | URL |
|-------|-------------|-----|
| “SaaS 已死，SaaS 到来”！Altman 预言 “全 AI 企业” 时代开启 | OpenAI CEO 奥尔特曼预言 “全 AI 企业” 将开启，AI 将从辅助工具进化为完全自主的执行者。OpenAI 产品很快将实现 100% 由 AI 编写代码，涵盖开发与决策全流程，标志着传统 “软件即服务（SaaS）” 模式向 “服 | [Link](https://longbridge.com/zh-HK/news/275993856.md) |
| 姚顺宇谷歌首秀，Gemini 新模型刷爆 SOTA：人类仅剩 7 人捍卫碳基编程 | 谷歌推出 Gemini 3 Deep Think 模型，取得 3455 Elo 分数，位列全球第 8，超越以往最高分 2727。该模型在 ARC-AGI-2 基准测试中得分 84.6%，刷新 SOTA，远超 Claude Opus 4.6  | [Link](https://longbridge.com/zh-HK/news/275891427.md) |
| AI 模型扎堆升级，国产算力需求狂飙，IDC 将迎来新一轮爆发？ | 美银指出，中国 AI 行业迎来关键转折：视频生成模型爆发将算力需求推升数个数量级，云服务与模型 API 全面涨价（智谱 AI 上调 30%、UCloud 全线调价），宣告价格战结束，定价权回归卖方。IDC 租赁价格企稳回升，世纪互联、万国数 | [Link](https://longbridge.com/zh-HK/news/275876097.md) |
| 为 AI 交易 “背书”！OpenAI 正敲定新一轮融资：以 8300 亿美元估值募资高达 1000 亿美元 | OpenAI 正以 8300 亿美元估值推进新一轮融资，目标筹集 1000 亿美元。软银拟领投 300 亿美元，亚马逊和英伟达可能各投 500 亿及 300 亿美元，微软拟投数十亿美元。本轮融资是 OpenAI 自去年秋季公司制改革以来的首 | [Link](https://longbridge.com/zh-HK/news/276298180.md) |
| 斯坦福专家：美国正跨入 “AI 收获期”，2025 年生产率增速有望翻倍至 2.7% | AI 生产力 “起飞” 的证据终于被宏观数据捕捉到了！斯坦福学者发文指出，美国 2025 年生产率增速有望翻倍至 2.7%，美国正在从 “AI 投入期” 跨入 “AI 收获期”。目前企业初级招聘正在下降，熟练使用 AI 的 “强力用户” 大 | [Link](https://longbridge.com/zh-HK/news/276004257.md) |

---

> **免責聲明**：本文內容僅供參考，不構成任何投資建議。