什麼是倖存者偏差?投資研究中的常見陷阱解析
1906 閱讀 · 更新時間 2026年2月5日
倖存者偏差是指傾向於將市場上現存的股票或基金的表現視為具有代表性的綜合樣本,而忽視那些已經倒閉的股票或基金。倖存者偏差可能導致對歷史業績和基金或市場指數的一般屬性過高估計。倖存者偏差風險是指基於公佈的投資基金回報數據而做出錯誤投資決策的機會。
核心描述
- 倖存者偏差 是一種常見傾向:在評估市場、股票或基金時,只觀察仍在交易或仍在披露業績的 “倖存者”,而那些表現不佳後被關閉、退市、清算或併購消失的對象,往往被悄然排除在視野之外。
- 由於基金清盤、股票退市、產品清算與併購等事件會把較弱的歷史記錄從數據集中移除,歷史平均表現可能被 “抬高”,風險也可能被 “壓低”,從而與真實經歷產生偏差。
- 投資者可以通過使用 point-in-time(時點) 的可投資標的範圍、納入已清盤基金與已退市股票,並對比 “僅倖存者” 與 “全樣本” 的研究結果,來降低倖存者偏差帶來的影響。
定義及背景
倖存者偏差(也稱 survivor bias)是一種抽樣誤差:你只能看到 “還存在的東西”。在投資領域,“可見集合” 往往是當下仍上市的股票、仍在運作的基金、仍在銷售的份額類別;而 “缺失集合” 則包括已退市公司、已清盤基金,以及被併購整合而不再單獨展示的產品——這些對象往往是在業績較差後退出樣本。
這之所以重要,是因為缺失數據並非隨機。失敗者更可能消失,數據集就會向贏家傾斜。結果是:管理人能力看起來更普遍、回撤似乎更小、長期平均回報也顯得更平滑,但這些都可能高估了全體同批產品或公司在真實歷史中的表現。換言之,倖存者偏差風險 是指基於公佈的投資基金回報數據而做出錯誤投資決策的機會。
倖存者偏差與其他研究陷阱相關但不相同:
- 選擇偏差(selection bias) 更廣泛:任何導致樣本不具代表性的選擇方式。倖存者偏差是其中一種特例,即 “未倖存者” 缺席。
- 前視偏差(look-ahead bias) 指未來信息泄漏到過去決策中(例如用最終的指數成分股名單回測歷史)。
- 回測偏差(backtest bias) 是更大的統稱,可能包含倖存者偏差、前視偏差與過擬合等問題。
計算方法及應用
快速覆蓋檢查:倖存者偏差率(SBR)
一個簡單的診斷方法是衡量起初的標的中,有多少仍然可被觀察到:
\[\text{SBR}=\frac{N_{\text{survivors}}}{N_{\text{initial}}}\]
若 SBR 較低,説明有大量路徑已經消失,倖存者偏差的風險通常更高。
衡量業績 “膨脹”(僅倖存者 vs 全樣本)
為了估計業績可能被高估的幅度,可以對比僅用倖存者計算的收益,與用全樣本(倖存者 + 未倖存者)計算的收益:
\[\Delta R=R_{\text{survivors}}-R_{\text{full}}\]
兩者需使用相同的加權方式(等權、市值加權或 AUM 加權)。若 \(\Delta R>0\),通常意味着存在倖存者偏差導致的業績 “抬高”。
這些計算常用於哪裏
- 基金研究: 比較主動管理 “品類平均”、同業排名或業績延續性研究。
- 股票篩選: 用僅包含當前仍上市股票的樣本測試因子或過濾條件,可能誇大命中率。
- 指數研究: 用 “今天的成分股” 去重建歷史(而不是使用逐期成分股),會嵌入類似倖存者偏差的失真。
小示例(假設情景,僅作説明,不構成投資建議)
假設 10 只基金同時起步。5 年後,6 只基金存續,平均收益為 +8%;另有 4 只基金在平均收益 -10% 後關閉。
- 僅倖存者平均 = +8%
- 全樣本平均 = \((6\times 8\%+4\times (-10\%))/10=0.8\%\)
差值顯示了倖存者偏差如何讓 “典型結果” 看起來顯著更好,而與全體同批產品的真實結果不一致。
優勢分析及常見誤區
採用 “考慮倖存者偏差” 的分析優勢
- 更貼近現實的收益估計: 納入已清盤基金與已退市股票後,歷史平均回報通常會降低,同時結果分佈會更分散。
- 更準確的風險度量: 當失敗者從樣本中消失時,波動率與最大回撤可能被低估;納入非倖存者有助於暴露尾部風險。
- 更公平的管理人對比: 當把缺失的落後者補回同業集合後,“四分位排名”“長期領先” 等主張往往會變得不那麼亮眼。
代價與侷限
- 數據處理更困難: 退市證券與已清盤基金的歷史可能存在代碼變更、標識符不一致或記錄不完整等問題。
- 不能解決所有問題: 消除倖存者偏差並不等於消除前視偏差、選擇偏差或數據挖掘等風險。
- 仍需關注市場環境變化: 即使歷史覆蓋完整,也不能保證未來與過去一致。
常見誤區
- “只要在熱門數據庫裏,就一定是完整數據。” 便捷數據集常是 “僅存續(live-only)”,這是倖存者偏差進入研究的常見來源。
- “指數歷史很長,説明是同一批公司一直在裏面。” 指數收益序列可能真實可靠,但成分會變動;把指數歷史解讀為 “長期持有同一批公司” 是另一種説法。
- “排行榜能證明優秀管理人長期穩定。” 各類榜單常排除已清盤、被併購吸收或停止披露的產品。
實戰指南
第 1 步:像歷史研究一樣定義投資範圍
明確寫出地區、資產類型、時間窗口與納入規則。對基金而言,需説明是否包含已清盤基金與不活躍的份額類別;對股票而言,需説明是否納入已退市股票與退市收益(delisting returns)。
第 2 步:要求使用時點(point-in-time)數據
降低倖存者偏差需要逐期 “當時可見” 的成員信息,例如:
- 指數逐期成分股(point-in-time index constituents)
- 保留已清盤或被併購基金的基金列表
- 不會把失敗者靜默刪除的公司行動(corporate action)歷史
第 3 步:對退出事件進行核對(退市、併購、清盤)
把退出視為 “結果”,而不是 “缺失值”。併購可能把弱業績隱藏在更強的同系產品之下;對股票而言,需要顯式處理退市事件,避免收益路徑直接消失。
第 4 步:始終同時披露兩種視角
在報告中同時發佈:
- 僅倖存者結果(許多儀表盤默認展示的口徑)
- 全樣本結果(倖存者 + 未倖存者)
並突出 CAGR、最大回撤與波動率在兩種口徑下的差異。
第 5 步:使用一份操作清單(快速審計)
| 項目 | 需要確認的問題 |
|---|---|
| 投資範圍 | 是否反映每個時點的可投資集合? |
| 覆蓋範圍 | 是否保留已清盤基金與已退市股票? |
| 時間一致性 | 篩選是否為時點口徑(無未來信息)? |
| 披露方式 | 是否同時展示僅倖存者與全樣本結果? |
| 穩健性 | 在更保守的退出假設下結果是否明顯變化? |
案例(假設情景,僅作説明,不構成投資建議)
分析師用 2005 到 2020 的數據做 “高質量股票” 回測,但樣本只包含今天仍存在的股票代碼。曲線看起來更平滑、回撤也顯得較小。改用無倖存者偏差的數據集(納入後來退市或破產的公司)後,該策略的波動率上升,最差年度收益變得更差。信號可能仍有參考價值,但對歷史的預期會更貼近現實,因為倖存者偏差不再把失敗者過濾掉。
關於券商篩選工具的一點説明
在 長橋證券(Longbridge) 等平台上,篩選工具可能更強調當前可交易標的,這對執行交易有幫助,但未必適合直接用於嚴謹的歷史推斷。若用於研究,建議與保留退市歷史與時點成員信息的數據源交叉驗證。
資源推薦
通俗參考
- 類似 Investopedia 風格的解釋文章:倖存者偏差、選擇偏差、前視偏差與回測偏差(適合快速理解定義與例子)
監管與披露標準
- 美國 SEC 關於業績宣傳與展示的材料
- 英國 FCA 關於信息 “清晰、公允且不具誤導性” 的指引
這些參考有助於理解為何在營銷與報告中,披露倖存者偏差相關方法很重要。
專業標準
- CFA Institute 課程中關於業績評估偏差的討論
- GIPS 關於一致性業績展示與可比性的相關理念
方法論文件
- 指數編制方關於調樣、成分變更與公司行動處理方式的方法説明
這些材料有助於區分 “指數歷史收益” 與 “成分股隨時間變化的成員結構” 各自代表的含義。
常見問題
投資中的倖存者偏差是什麼?
倖存者偏差是指在分析時只看仍然存在的基金或股票,而忽略那些已經關閉、被併購整合、退市或破產的對象。由於失敗者更可能消失,研究結果往往會比全體同批對象的真實經歷更樂觀。
為什麼倖存者偏差通常會抬高業績?
表現較差的產品更可能清盤或從數據庫中移除。當這些負面結果消失後,樣本會向贏家傾斜,從而提高平均回報,並且常常讓波動率與回撤看起來更低。
投資者最常在哪裏遇到倖存者偏差?
常見場景包括:公募基金排名、遺漏 “dead funds” 的對沖基金數據庫、排除退市股票的股票篩選,以及用今天的指數成分股去模擬過去的回測。
倖存者偏差等同於選擇偏差或前視偏差嗎?
不等同。選擇偏差指任何導致樣本不具代表性的選擇方式;前視偏差指使用了當時不可得的未來信息;倖存者偏差特指 “未倖存者缺失”,從而讓可見數據系統性偏樂觀。
如何在報告或數據集中識別倖存者偏差?
留意諸如 “active funds(在運作基金)”“current constituents(當前成分)”“available tickers(可用代碼)” 等表述,並檢查方法説明是否解釋了清盤、退市、清算與併購的處理方式。若納入規則不清晰,應默認存在倖存者偏差風險。
倖存者偏差對指數投資也重要嗎?
對研究分析尤其重要。若用今天的指數成分重建歷史,會遺漏被剔除或失敗的成分。官方指數總回報序列可能相對穩健,但成分變更仍會影響你對 “這段歷史代表什麼” 的解釋。
總結
倖存者偏差會通過排除已經消失的失敗者,讓市場、基金與策略看起來更賺錢、風險更低,從而高估歷史業績與一般屬性。應對它通常不是依靠單一指標,而是一套研究實踐:清晰定義投資範圍、使用時點數據、納入未倖存者,並對比僅倖存者與全樣本結果。把 “消失的失敗” 當作結果的一部分納入分析,能幫助形成更貼近現實的預期,並支持更審慎的決策。
