--- title: "短短几分鐘,AI 輕鬆通過了 CFA 三級考試" description: "最新研究顯示,多個 AI 模型已能在幾分鐘內通過享有盛譽的 CFA 三級考試,而人類通常需要數年學習。其中 Gemini 2.5 Pro 綜合表現最佳,國產 KIMI K2 在多選題正確率達 78.3%。儘管 AI 考試表現出色,但專家認為在情境理解等方面仍難以完全替代人類金融專業人士。" type: "news" locale: "zh-HK" url: "https://longbridge.com/zh-HK/news/258796277.md" published_at: "2025-09-25T03:34:12.000Z" --- # 短短几分鐘,AI 輕鬆通過了 CFA 三級考試 > 最新研究顯示,多個 AI 模型已能在幾分鐘內通過享有盛譽的 CFA 三級考試,而人類通常需要數年學習。其中 Gemini 2.5 Pro 綜合表現最佳,國產 KIMI K2 在多選題正確率達 78.3%。儘管 AI 考試表現出色,但專家認為在情境理解等方面仍難以完全替代人類金融專業人士。 最新研究顯示,多個 AI 模型已能在幾分鐘內通過享有盛譽的 CFA 三級考試,而人類通常需要數年時間和約 1000 小時學習才能完成。 紐約大學斯特恩商學院和 AI 財富管理平台 GoodFin 的研究人員測試了 23 個大型語言模型,發現包括 o4-mini、Gemini 2.5 Pro 和 Claude Opus 在內的前沿推理模型能夠成功通過 CFA 三級模擬考試。 這些模型採用"思維鏈提示"技術,有效應對了此前令 AI 頭疼的論文題型。GoodFin 創始人兼首席執行官 Anna Joo Fee 表示: > 我認為這項技術絕對有未來改變整個行業的可能。 ## AI 模型全面突破 CFA 三級考試壁壘 兩年前的研究曾發現,AI 模型能夠通過 CFA 一級和二級考試,但在三級考試的論述題環節遭遇重大障礙。 最新研究證實,AI 技術的快速發展已經克服了這一關鍵瓶頸。 研究團隊對 23 個大型語言模型進行了全面測試,特別關注 AI 模型是否具備"專業金融決策所需的專業化、高風險分析推理能力",以此評估其在 CFA 三級模擬考試中處理選擇題和論文題的能力。 研究結果表明,在處理複雜金融問題時,推理模型的表現顯著優於傳統的非推理模型。特別是採用"思維鏈提示"技術的前沿推理模型成功通過了相關考試測試。 **其中 Gemini 2.5 Pro 在論述題評分中獲得 3.44 分的最高成績,同時在綜合表現(選擇題和論述題)中以 2.1 分位居榜首。** **值得注意的是,國產的 KIMI K2 模型在多選題中表現最佳,正確率高達 78.3%,超過谷歌的 Gemini 2.5 Pro 和 GPT-5。** 研究採用了零樣本、自我一致性和自我發現三種提示策略,其中自我一致性策略取得 73.4% 的最佳表現評分。 在成本效益分析中,Llama 3.1 8B Instant 獲得 5468 的最佳成本效率評分,而 Palmyra Fin 以 0.3 秒的平均響應時間成為速度最快的模型。 儘管 AI 在標準化考試中表現出色,但業內專家認為完全替代人類金融專業人士仍存在侷限。Fee 強調: > 諸如情境理解和意圖判斷等方面,機器目前還難以準確評估。這正是人類的優勢所在,能夠理解客户的肢體語言和各種暗示。 ### Related Stocks - [OpenAI.NA - OpenAI](https://longbridge.com/zh-HK/quote/OpenAI.NA.md) - [AI.US - C3.ai](https://longbridge.com/zh-HK/quote/AI.US.md) - [GEMI.US - Gemini Space Station](https://longbridge.com/zh-HK/quote/GEMI.US.md) ## Related News & Research | Title | Description | URL | |-------|-------------|-----| | “SaaS 已死,SaaS 到来”!Altman 预言 “全 AI 企业” 时代开启 | OpenAI CEO 奥尔特曼预言 “全 AI 企业” 将开启,AI 将从辅助工具进化为完全自主的执行者。OpenAI 产品很快将实现 100% 由 AI 编写代码,涵盖开发与决策全流程,标志着传统 “软件即服务(SaaS)” 模式向 “服 | [Link](https://longbridge.com/zh-HK/news/275993856.md) | | 姚顺宇谷歌首秀,Gemini 新模型刷爆 SOTA:人类仅剩 7 人捍卫碳基编程 | 谷歌推出 Gemini 3 Deep Think 模型,取得 3455 Elo 分数,位列全球第 8,超越以往最高分 2727。该模型在 ARC-AGI-2 基准测试中得分 84.6%,刷新 SOTA,远超 Claude Opus 4.6 | [Link](https://longbridge.com/zh-HK/news/275891427.md) | | AI 模型扎堆升级,国产算力需求狂飙,IDC 将迎来新一轮爆发? | 美银指出,中国 AI 行业迎来关键转折:视频生成模型爆发将算力需求推升数个数量级,云服务与模型 API 全面涨价(智谱 AI 上调 30%、UCloud 全线调价),宣告价格战结束,定价权回归卖方。IDC 租赁价格企稳回升,世纪互联、万国数 | [Link](https://longbridge.com/zh-HK/news/275876097.md) | | 为 AI 交易 “背书”!OpenAI 正敲定新一轮融资:以 8300 亿美元估值募资高达 1000 亿美元 | OpenAI 正以 8300 亿美元估值推进新一轮融资,目标筹集 1000 亿美元。软银拟领投 300 亿美元,亚马逊和英伟达可能各投 500 亿及 300 亿美元,微软拟投数十亿美元。本轮融资是 OpenAI 自去年秋季公司制改革以来的首 | [Link](https://longbridge.com/zh-HK/news/276298180.md) | | 斯坦福专家:美国正跨入 “AI 收获期”,2025 年生产率增速有望翻倍至 2.7% | AI 生产力 “起飞” 的证据终于被宏观数据捕捉到了!斯坦福学者发文指出,美国 2025 年生产率增速有望翻倍至 2.7%,美国正在从 “AI 投入期” 跨入 “AI 收获期”。目前企业初级招聘正在下降,熟练使用 AI 的 “强力用户” 大 | [Link](https://longbridge.com/zh-HK/news/276004257.md) | --- > **免責聲明**:本文內容僅供參考,不構成任何投資建議。