--- type: "Learn" title: "機率密度函數 PDF 是什麼?投資與風控全解析" locale: "zh-HK" url: "https://longbridge.com/zh-HK/learn/probability-density-function--102316.md" parent: "https://longbridge.com/zh-HK/learn.md" datetime: "2026-04-30T00:37:18.664Z" locales: - [en](https://longbridge.com/en/learn/probability-density-function--102316.md) - [zh-CN](https://longbridge.com/zh-CN/learn/probability-density-function--102316.md) - [zh-HK](https://longbridge.com/zh-HK/learn/probability-density-function--102316.md) --- # 機率密度函數 PDF 是什麼?投資與風控全解析

概率密度函數(Probability Density Function, PDF)是描述連續型隨機變量在各個取值點處概率密度的函數。它用於衡量隨機變量在某個特定取值範圍內出現的可能性大小。概率密度函數的特點是其函數值越高,表示隨機變量在該點附近出現的可能性越大。PDF 的積分值在整個定義域上等於 1,表示隨機變量在其取值範圍內的總概率為 1。具體來説,對於連續型隨機變量 X 及其概率密度函數 f(x),在區間 [a,b] 內隨機變量取值的概率可以表示為:

常見的概率密度函數包括正態分佈、指數分佈和均勻分佈等。

## 核心描述 - 概率密度函數(Probability Density Function, PDF)是一種用曲線來描述連續變量不確定性的方法,適用於日收益、利率變動或投資組合損失等場景,而不是用離散概率列表來表達。 - 核心規則是:概率來自 _在某個區間內曲線下的面積_,而不是來自曲線在某個點的高度。這也是很多概率密度函數誤解的來源。 - 在投資與風險分析中,只要尊重模型邊界與估計誤差,概率密度函數可以把數據與假設轉化為可執行的輸出,例如尾部概率、VaR(Value at Risk)、ES(Expected Shortfall)以及情景區間範圍。 * * * ## 定義及背景 ### 概率密度函數的含義(通俗解釋) 概率密度函數(常簡稱為 “PDF”)描述的是:概率如何在一個 **連續型** 隨機變量的可能取值上被 “分佈開來”。“連續型” 意味着變量在某個範圍內可以取無限多個值。例如,1 日股票收益率可以是 0.10%、0.11%、0.109% 等等。 概率密度函數通常記為 \\(f(x)\\),並滿足 2 個性質: - 不為負:\\(f(x)\\ge 0\\) - 曲線下的總面積為 1: \\\[\\int\_{-\\infty}^{\\infty} f(x)\\,dx = 1\\\] ### 為什麼 “看面積,不看高度” 很重要 對於概率密度函數,變量落在區間 \\(\[a,b\]\\) 的概率為: \\\[P(a\\le X\\le b)=\\int\_a^b f(x)\\,dx\\\] 這一個公式解釋了概率密度函數在金融中多數正確用法: - 你為收益或損失估計或假設一個概率密度函數; - 你對關心的區域(某個範圍、某段尾部、壓力區間)做積分; - 你把得到的面積解讀為概率。 因為 PDF 描述的是連續變量,落在任何一個精確點上的概率可以視為 0:\\(P(X=x)=0\\)。因此,\\(f(x)\\) 的 “高度” 本身不是概率。 ### 概率密度函數概念的來源,以及金融為什麼在意它 概率密度函數來自經典概率論與微積分,在連續型分佈被嚴格形式化後成為標準工具。金融領域採用 PDF 的思路,是因為很多核心問題本質上是連續的: - 收益與收益率變動常被建模為連續變量; - 損失分佈需要關注尾部概率; - 衍生品定價依賴某種假設或隱含的分佈,常用概率密度函數來概括。 在期權市場中,交易者常提到 “隱含分佈”。簡化來説,一組不同行權價的期權價格可以用於反推出未來價格的 _風險中性_ 分佈,並可用概率密度函數表達。這個概率密度函數並不等同於真實世界收益的預測,而是在風險中性測度下與定價一致的分佈。儘管如此,它仍常被用於情景討論與壓力溝通。 * * * ## 計算方法及應用 ### 方法 1:從 CDF 推出概率密度函數(教科書式路徑) 如果你已知累積分佈函數 \\(F(x)=P(X\\le x)\\) 且它可導,那麼概率密度函數為: \\\[f(x)=F'(x)\\\] 在實踐裏,投資者很少從已知的 \\(F(x)\\) 開始。更常見的是從數據估計 PDF,或假設某個分佈族(正態分佈、t 分佈等)並進行擬合。 ### 方法 2:參數化擬合(先假設形狀,再估計參數) 常見流程是: 1. 選擇一個分佈族(正態分佈、Student’s t 分佈、偏度 t 分佈等); 2. 用歷史數據估計其參數(常用極大似然估計); 3. 用擬合後的概率密度函數計算概率、分位數或風險指標。 參數化 PDF 模型受歡迎的原因是簡單、速度快,且易於嵌入投研與風控系統。代價是模型風險:如果分佈形狀假設不對(尤其是尾部),基於 PDF 的輸出可能會誤導判斷。 ### 方法 3:非參數估計(讓數據決定曲線形狀) 如果不想綁定某個分佈族,可以用核密度估計(KDE)等方法來估計 PDF。KDE 會生成一條平滑曲線,近似未知密度。 對投資者更實用的理解是:KDE 能反映歷史收益的偏度、多峯結構或不尋常形態。但它對參數設置(如帶寬)與樣本量敏感。 ### 方法 4:變量變換(當你對收益或價格做變換) 金融中經常做變量變換:價格到對數價格、簡單收益到對數收益、收益率到價格等。若 \\(Y=g(X)\\) 且映射滿足常規條件,可使用變量變換公式: \\\[f\_Y(y)=f\_X(x(y))\\left|\\frac{dx}{dy}\\right|\\\] 當你為某個口徑(例如對數收益)估計了 PDF,但需要以另一口徑(例如價格變動)表達概率時,這一點尤其重要。 * * * ### 應用:概率密度函數如何進入投資工作流 #### 1) 用於情景區間的區間概率估計 假設 \\(X\\) 為某指數 1 日收益率,你想計算: - “平穩日” 的概率:\\(P(-0.5\\%\\le X\\le 0.5\\%)\\) - “大跌日” 的概率:\\(P(X\\le -2\\%)\\) 用 PDF,這兩者都通過面積計算。相較只給出波動率,這更有信息量,因為波動率本身並不刻畫偏度與尾部厚度。 #### 2) VaR 與 ES(聚焦尾部) 很多風險指標可以用損失分佈表達,而損失分佈常由概率密度函數概括: - VaR(Value at Risk)是損失分佈的一個分位數; - ES(Expected Shortfall)是超過某個尾部閾值後的平均損失。 即便系統以數值方法計算 VaR 或 ES,其底層思想仍是基於 PDF:你在使用分佈的尾部面積。 #### 3) 衍生品定價與 “風險中性” 密度 期權價格包含市場對未來價格不確定性的定價信息。在常見框架下,不同行權價的期權價格與到期時標的的風險中性概率密度函數相關。 對投資者而言,關鍵的實務點是:市場隱含的概率密度函數可以用來討論 _在定價測度下市場在不同價格區間 “定價為更可能或更不可能”_,但不應被當作真實世界概率的直接預測。 #### 4) 壓力測試與狀態(regime)思維 單一 PDF 可能掩蓋狀態切換(如平穩期 vs 危機期)。更貼近現實的做法是對比不同階段的密度: - “平穩期” 樣本往往對應更窄的 PDF; - “危機期” 樣本往往對應更寬、尾部更厚的 PDF。 這種對比能提升風險溝通質量:與其給出一個波動率數字,不如展示整個分佈形態如何變化。 * * * ## 優勢分析及常見誤區 ### 概率密度函數 vs 相關概念(何時用什麼) 理解相鄰概念有助於避免誤用。 概念 描述內容 典型金融用途 常見混淆 概率密度函數(PDF) 連續結果的 “密度”,概率來自面積 收益建模、損失尾部、期權隱含分佈 把高度當概率 PMF(probability mass function) 離散結果的概率 信用事件、違約/不違約、成交筆數 用 PMF 的規則處理連續數據 CDF \\(P(X\\le x)\\),單調遞增 分位數、VaR 閾值 忘記 CDF 本身就是概率 似然(Likelihood) 在給定數據下參數有多 “合理” MLE 擬合、模型比較 不加先驗就把它當作參數的概率 ### 使用概率密度函數的優勢 - **對不確定性的緊湊表達:** 概率密度函數把位置、分散度、偏度與尾部放在同一個對象裏。 - **天然適配尾部問題:** 金融裏很多問題是尾部問題,PDF 讓尾部面積一目瞭然。 - **支持仿真與情景生成:** 有了 PDF(或擬合模型),可以進行模擬生成情景路徑。 - **便於模型對比:** 你可以對比不同 PDF 形狀,並觀察尾部概率如何變化。 ### 侷限與風險(可能出錯的地方) - **對假設敏感:** 正態分佈 PDF 若用於厚尾市場,可能低估崩盤風險。 - **估計誤差:** 歷史樣本有限時,估計的 PDF 可能不穩定,尤其是尾部數據稀缺。 - **精確感錯覺:** 平滑的 PDF 曲線看起來很 “精細”,但輸入可能很脆弱。 - **非平穩性:** 金融收益分佈會隨時間變化,用某段時期估計的 PDF 未必適用於另一段時期。 ### 常見誤區(以及如何糾正) #### 誤區 1:“PDF 的函數值就是概率” 不對。連續變量的概率來自面積而非高度。\\(f(x)\\) 是帶單位的密度(例如 “每 1% 收益的密度”),不能直接讀成概率。 #### 誤區 2:“PDF 超過 1 就不合法” PDF 可以超過 1,因為要求是 _整體積分為 1_,而不是每個點都小於 1。方差很小、分佈很集中的情況下峯值會更高。 #### 誤區 3:“不同單位下的 PDF 高度可以直接比較” PDF 依賴計量單位:用小數表示收益 vs 用百分數表示收益,PDF 會隨尺度重標定。不統一單位就比較高度沒有意義。 #### 誤區 4:“擬合得好的 PDF 就能預測未來” PDF 是在特定假設與樣本選擇下對不確定性的模型總結。它能輔助規劃與倉位風險,但無法消除狀態切換、結構性斷裂或流動性衝擊。 * * * ## 實戰指南 ### 用概率密度函數做組合風險分析的分步流程 這是一套可用表格或統計工具落地的流程,重點服務於依賴區間與尾部的決策場景。 #### Step 1:選擇真正關心的變量與期限 示例: - 組合 1 日收益 - 債券收益率 1 周變動 - 1 個月最大回撤(注意:回撤比簡單收益更復雜) 要明確口徑,因為日收益的 PDF 不能在沒有額外假設的前提下直接複用到月度結果。 #### Step 2:以 “風控視角” 清洗數據 - 使用一致口徑的收盤到收盤收益(或其他一致定義)。 - 記錄缺失值處理方式。 - 檢查極端點是數據錯誤還是真實事件。 未清洗的數據會製造虛假尾部或掩蓋真實尾部。 #### Step 3:至少估計 2 種 PDF(做模型對比) 實務上一個最低配置是: - 一個簡單參數化 PDF(例如正態分佈或 t 分佈) - 一個非參數 PDF(例如 KDE) 目標不是找出 “唯一正確” 的 PDF,而是理解結論對密度選擇有多敏感。 #### Step 4:問區間與尾部問題,而不是點概率問題 示例: - \\(P(X\\le -2\\%)\\) 是多少? - \\(P(-1\\%\\le X\\le 1\\%)\\) 是多少? - \\(P(X\\le -2\\%)\\) 在不同模型下如何變化? 這些問題與 PDF 的 “面積” 機制匹配。 #### Step 5:有意識地對尾部做壓力測試 如果決策依賴極端結果,應該測試更厚尾的假設。例如對比正態分佈 PDF 與 Student’s t 分佈 PDF。最大的差異通常出現在尾部概率上,而尾部概率會影響風控限額與回撤預期。 * * * ### 案例:用概率密度函數對比 “正態” 與 “厚尾” 的損失風險(合成示例) 這是 **僅用於教學的合成示例,不構成投資建議**。數字用於説明:PDF 假設會如何改變尾部結論。 #### 設定 你用以下假設建模某寬基股票指數的 1 日收益: - 均值約為 0(為簡化忽略) - 日波動率 1% 比較兩種 PDF 選擇: - 模型 A:正態分佈,\\(\\sigma=1\\%\\) - 模型 B:Student’s t 分佈,尺度相同但尾部更厚(常用於刻畫類似 “崩盤” 的行為) #### 問題 1 日收益 **小於等於 -3%** 的概率是多少,即 \\(P(X\\le -3\\%)\\)? - 在正態分佈 PDF 且 \\(\\sigma=1\\%\\) 下,-3% 相當於 -3 個標準差,左尾概率約為 **0.13%**(大約 770 個交易日出現 1 次)。 - 在厚尾 PDF 下,-3% 的概率可能更高(具體數值取決於自由度與尺度設定)。在貼近真實收益的擬閤中,常見情形是尾部概率與正態假設相比存在明顯差異。 #### 為什麼重要 類似 “我們可以承受每隔幾年出現一次 -3% 日跌幅” 的風險規則,本質上依賴尾部面積。如果 PDF 假設過於薄尾,你可能低估大虧發生頻率,從而設定過於樂觀的風險限額。 #### 實務要點 當決策依賴尾部結果時,不要只依賴一條 PDF 曲線。至少對比一種薄尾與一種厚尾設定,並把差異視為需要管理的模型風險。 * * * ## 資源推薦 ### 建立概率密度函數直覺的學習方向 - **概率與統計入門:** 重點掌握連續分佈、CDF 與 PDF 的關係,以及基於積分的概率計算。 - **時間序列與計量經濟學:** 理解收益分佈為何會隨時間變化、波動率聚集,以及平穩性假設對 PDF 的影響。 - **風險管理:** 學習損失分佈、分位數與尾部風險指標,理解 PDF 如何進入制度化決策。 - **衍生品與期權定價:** 理解分佈在定價中的作用,包括期權價格隱含的風險中性概率密度函數思想。 ### 可遷移到投研/風控工作的練習建議 - 對同一條收益序列擬合 2 種不同的 PDF,並對比尾部概率。 - 在兩個不同窗口(平穩期 vs 高波動期)估計 KDE PDF,比較密度形狀如何遷移。 - 使用概率積分變換(PIT)或 QQ 圖檢查你的 PDF 是否系統性低估或高估尾部。 ### 展示概率密度函數時建議記錄的信息 - 數據頻率與期限(每日、每週、每月) - 樣本區間(以及選擇理由) - 模型選擇(參數分佈族或 KDE 設定) - 已知限制(樣本小、狀態切換、低流動性階段等) 這些記錄往往比曲線本身 “看起來多平滑” 更重要。 * * * ## 常見問題 ### 如何用最簡單的話解釋概率密度函數? 概率密度函數是一條用於連續變量的曲線:某個範圍內的概率等於該範圍下曲線的面積。不要把曲線上某個點的高度當作概率。 ### 概率密度函數可以大於 1 嗎? 可以。PDF 可以超過 1,只要對全域積分的總面積等於 1 即可。分佈越集中,峯值可能越高。 ### 如何從概率密度函數計算實際概率? 對區間做積分: \\\[P(a\\le X\\le b)=\\int\_a^b f(x)\\,dx\\\] 實務中通常由軟件通過 CDF 或數值積分完成。 ### 為什麼連續變量有 \\(P(X=x)=0\\)?這會讓 PDF 沒用嗎? 連續變量的概率分散在無限多個點上,所以精確落在某一點的概率為 0。但現實問題通常是區間問題,例如 “在 -1% 到 0% 之間” 或 “差於 -2%”,因此 PDF 依然非常有用。 ### 從期權得到的市場隱含概率密度函數,是對未來收益的預測嗎? 不一定。它通常被理解為與期權價格一致的 _風險中性_ 概率密度函數,用於定價而非預測真實世界概率。它仍可用於情景討論,但不應當作確定性的預測。 ### 投資者在看 PDF 圖時最常犯的錯誤是什麼? 把兩個點的高度直接比較並當作 “更可能”,但沒有把它轉換為區間概率,也沒有檢查單位、KDE 帶寬或模型假設是否改變了 PDF 的尺度。 * * * ## 總結 概率密度函數為連續型金融變量的不確定性提供了一種清晰表達:把 “未知的未來結果” 轉化為可計算的結構,使概率通過面積來衡量。用得好,概率密度函數能支持區間思維、尾部風險度量與基於模型的情景分析;用得不當,則容易帶來 “看似精細” 的錯覺,尤其當把曲線高度誤當概率,或用薄尾假設處理厚尾市場時。更穩健的做法是把任何概率密度函數都視為決策輔助工具:對比多個合理的密度模型,聚焦真正驅動風險結果的尾部面積,並完整記錄假設與限制,確保在市場狀態變化時結論仍可解釋、可複核。