頻率分佈是什麼?投資中如何用直方圖刻畫風險
1635 閱讀 · 更新時間 2026年6月16日
頻率分佈是一種以圖形或表格形式表示的表徵,在給定的區間內顯示觀測次數的統計量。頻率是指一個值在一個區間內出現的次數,而分佈是指變量的頻率模式。區間大小取決於所分析的數據和分析師的目標。區間必須是相互獨立且窮盡的。頻率分佈通常用於統計上下文中。通常,頻率分佈與正態分佈的繪製有關。
核心描述
- 頻率分佈是一種以圖形或表格形式表示的表徵,在給定的區間內顯示觀測次數的統計量,可以把原始市場數據轉化為一個結構化視圖,展示某些結果出現的頻率,例如:日收益率落在特定區間內的次數。
- 通過把觀測值分組到若干區間(分組/箱子,bins)並統計每個區間內出現的次數,頻率分佈幫助投資者區分 “常見情況” 和 “相對少見的波動”。
- 配合頻率表或直方圖使用時,頻率分佈可以支持風險討論、模型檢驗,以及在不做預測的前提下溝通不確定性。
定義及背景
什麼是頻率分佈
頻率分佈 是一種以圖形或表格形式表示的表徵,在給定的區間內顯示觀測次數的統計量。頻率是指一個值在一個區間內出現的次數,而分佈是指變量的頻率模式。區間大小取決於所分析的數據和分析師的目標,區間必須彼此互斥且窮盡。
在投資場景中,頻率分佈通常用來描述收益率分佈、成交量、價差或回撤分佈等。與其盯着幾百個原始數據點,不如用頻率分佈得到一個有結構的視圖:哪裏是集中區域(常見情況),哪裏是尾部(不常見但可能很重要的結果)。在統計實踐中,人們也常用頻率分佈來對照、理解正態分佈等理論模型。
為什麼投資者會使用它
市場數據噪聲很大。頻率分佈可以幫助回答一些實用問題:日度波動多數都很小嗎?大跌日出現得有多頻繁?收益分佈大致對稱還是帶偏?這並不是在預測下一步市場會怎麼走,而是利用歷史觀測結果對波動範圍建立一個 “經驗框架”,以便支持關於倉位控制、分散化和壓力情景的討論。需要注意的是,過去的數據未必代表未來的市場狀態。
頻率表 vs 直方圖
頻率表用文字列出各個區間和對應的次數;直方圖 則用條形高度來可視化這些次數。二者其實表示的是同一個頻率分佈。直方圖更易於快速理解整體形狀,而頻率表則更方便審閲、在表格軟件中複用和做進一步計算。
計算方法及應用
如何構建一個頻率分佈(分步説明)
- 選擇變量(例如:日收益率,單位為 %)。
- 選擇樣本窗口(例如:過去 3 年的所有交易日)。
- 設定區間邊界(例如:-3% 到 -2%、-2% 到 -1%、……)。
- 統計每個區間內的觀測次數(頻數)。
- 可選步驟:計算相對頻率和累計頻率。
如果第 \(i\) 個區間的觀測次數為 \(n_i\),樣本總觀測數為 \(N\),則相對頻率為:
\[f_i=\frac{n_i}{N}\]
簡短示例(示意性質)
下面的表格只是示意,並非基於任何具體交易品種或指數的數據。它僅用於學習説明,不構成投資建議。
| 日收益率區間 | 頻數(天數) | 相對頻率 |
|---|---|---|
| -3.0% 到 -2.0% | 8 | 0.8% |
| -2.0% 到 -1.0% | 28 | 2.8% |
| -1.0% 到 0.0% | 210 | 21.0% |
| 0.0% 到 1.0% | 235 | 23.5% |
| 1.0% 到 2.0% | 35 | 3.5% |
這個頻率分佈展示了結果在哪些區間聚集,以及樣本中是否出現明顯的尾部。
常見金融應用場景
- 風險刻畫: 利用頻率分佈討論 “損失超過某個閾值(例如:跌幅超過 -2%)” 出現的頻率。這是一種描述性方法,並不能降低虧損風險本身。
- 策略診斷: 如果回測聲稱收益平穩,可以通過月度收益率的頻率分佈檢查是否存在平均值掩蓋的尾部虧損。需要注意回測具有侷限性,結果不一定能在實盤中復現。
- 流動性與交易執行評估: 對買賣價差或滑點做頻率分佈,可以區分典型交易環境與壓力情形下的表現。
- 模型檢驗: 將實際觀測到的收益率頻率分佈,與所假設的模型(例如:對稱性、尾部厚度)進行對比,在依賴簡化風險指標之前,先評估假設是否合理。
優勢分析及常見誤區
優勢
- 清晰度: 頻率分佈可以把大批量數據壓縮成一個易於理解的結構。
- 尾部意識: 它有助於暴露那些平均值容易掩蓋、但影響較大的極端結果。
- 溝通效率: 通過直方圖,團隊成員可以更直觀地理解 “正常波動” 大致指什麼,而不必依賴幾個零散的例子。
侷限(它做不到什麼)
- 不是預測工具: 頻率分佈只描述一個樣本。市場狀態會發生變化。
- 區間設定有影響: 不同的區間寬度會改變視覺印象和細節程度。
- 忽略時間順序: 它看不到序列或聚集效應(例如:危機期間大幅波動集中出現),除非再輔以時間序列圖一起分析。
常見誤區
- “大部分結果落在一個區間裏,所以風險很低。” —— 集中分佈可以與 “肥尾” 同時存在。
- “直方圖看起來對稱,就説明盈虧平衡。” —— 圍繞 0 對稱並不保證極端漲跌在幅度和風險上是對稱的。
- “區間越多越好。” —— 區間過多可能使頻率分佈過度擬合樣本中的隨機噪聲,看起來很亂而難以解釋。
實戰指南
如何選擇既清晰又易讀的區間
一個實用的頻率分佈需要在細節和可讀性之間取得平衡:
- 對日度股指收益,可以先嚐試 0.5% 或 1.0% 為區間寬度,如果直方圖看起來過於平、或過於鋸齒,再做調整。
- 在比較不同時間區間時,儘量保持區間邊界一致(例如:前後兩個不同波動階段採用同一組區間)。
- 清楚標註收益是算術收益率還是對數收益率,以及是收盤對收盤(close-to-close)還是其他口徑。
常用工具下的工作流程
- 表格軟件: 導出價格數據,計算收益率,再使用直方圖工具或結合 COUNTIFS 函數對不同區間計數,構建頻率分佈。
- 券商導出數據: 如果從包括 長橋證券 在內的平台下載歷史價格數據,先確保時間戳一致、公司行為(分紅、拆並股等)和缺失交易日已經處理清楚,再用這些清洗後的數據構建頻率分佈。
案例分析(虛構,僅用於學習)
假設一位分析師對某大型美國股指過去 5 年的日度收益率,用 1% 為區間寬度構建頻率分佈,發現:
- 約 70% 的交易日收益率落在 -1% 到 +1% 之間;
- 大約 4% 的交易日跌幅超過 -2%;
- 在包含多次危機的子樣本期間,左側尾部的質量略大於右側尾部。
實際用法上,這位分析師並不用它來預測收益,而是用頻率分佈來核對一條壓力規則(例如:“要做好偶爾出現 -2% 跌幅的準備”)是否大致和歷史記錄相符,並通過直方圖來展示不確定性,而不是隻給一個平均值。這一例子純屬假設,不構成任何投資建議。
資源推薦
加深直覺理解
- 統計學入門教材中關於直方圖、分組和抽樣波動性的章節,重點放在理解和解讀上,而非複雜數學推導。
- 注重風險的讀物中關於收益分佈、偏度和肥尾的部分,有助於理解頻率分佈形狀在金融中的重要性。
可練習的數據集(公開資源)
- 各大交易所和指數公司公開的歷史日度價格和指數數據,或央行提供的利率時間序列。可以用來構建收益率或收益率變動的頻率分佈,對比平穩時期和壓力時期的差異。在使用外部數據時,記錄數據來源、時間區間,以及任何清洗和調整步驟。
能力自查清單
- 你能否清楚説明自己為什麼這樣劃分區間?
- 你是否能從原始數據中復現自己的頻率表?
- 你是否能在使用相同區間和時間窗口的前提下,對比兩張頻率分佈圖?
常見問題
頻率分佈和概率分佈有什麼區別?
頻率分佈總結的是樣本中實際觀測到的次數;概率分佈則是一個關於 “發生可能性” 的理論模型。你可以用頻率分佈來檢查一個給定概率模型是否合理,但兩者並不是同一回事。
收益率直方圖應該用多少個區間?
沒有放之四海而皆準的答案。可以從符合直覺的劃分開始(例如:日波動按 0.5% 或 1% 劃分),如果頻率分佈過於粗糙或過於噪聲,再做微調。區間太少會掩蓋細節,太多則可能放大隨機噪聲。
為什麼我換一個時間區間,頻率分佈就變了?
因為市場狀態會變化。波動率、相關性和流動性在不同時間段可能非常不同。頻率分佈對樣本選擇很敏感,所以在比較不同區間時,要使用一致的規則,並明確説明可能存在的 “市場狀態切換”。
我可以用頻率分佈來計算 VaR(在險價值)嗎?
頻率分佈可以在歷史分位數法中輔助你觀察尾部 “截點” 大致位於哪裏,但 VaR 本身有專門的定義和實現細節。更穩妥的做法是把直方圖當作透明化風險信息的工具,而不是把它當作完整風險管理流程的替代。
總結
頻率分佈是一種結構化方式,用來把原始市場數據轉化為對 “哪些結果常見、哪些結果相對少見” 的理解,這種理解總是基於某個特定樣本。只要在構建時認真選擇區間、保持時間窗口的前後一致、並在解讀時保持謹慎,它就能有效支持風險討論、時期對比以及模型假設檢驗。同時需要記住,頻率分佈應與時間序列背景信息配合使用,而不應被當作預測工具本身。
