---
type: "Learn"
title: "機率密度函數 PDF 是什麼？投資與風控全解析"
locale: "zh-HK"
url: "https://longbridge.com/zh-HK/learn/probability-density-function--102316.md"
parent: "https://longbridge.com/zh-HK/learn.md"
datetime: "2026-04-30T00:36:52.171Z"
locales:
  - [en](https://longbridge.com/en/learn/probability-density-function--102316.md)
  - [zh-CN](https://longbridge.com/zh-CN/learn/probability-density-function--102316.md)
  - [zh-HK](https://longbridge.com/zh-HK/learn/probability-density-function--102316.md)
---

# 機率密度函數 PDF 是什麼？投資與風控全解析

<p>概率密度函數（Probability Density Function, PDF）是描述連續型隨機變量在各個取值點處概率密度的函數。它用於衡量隨機變量在某個特定取值範圍內出現的可能性大小。概率密度函數的特點是其函數值越高，表示隨機變量在該點附近出現的可能性越大。PDF 的積分值在整個定義域上等於 1，表示隨機變量在其取值範圍內的總概率為 1。具體來説，對於連續型隨機變量 X 及其概率密度函數 f(x)，在區間 [a,b] 內隨機變量取值的概率可以表示為：</p><figure class="image image_resized" style="width: 33.38%"><img src="https://pub.pbkrs.com/social/2024/0/S8L26J4EdTKpwAzonskuK7RpRPbNNJMJ.jpg?x-oss-process=style/lg" original-src="https://pub.pbkrs.com/social/2024/0/S8L26J4EdTKpwAzonskuK7RpRPbNNJMJ.jpg"/></figure><p>常見的概率密度函數包括正態分佈、指數分佈和均勻分佈等。</p>

## 核心描述

-   概率密度函數（Probability Density Function, PDF）是一種用曲線來描述連續變量不確定性的方法，適用於日收益、利率變動或投資組合損失等場景，而不是用離散概率列表來表達。
-   核心規則是：概率來自 _在某個區間內曲線下的面積_，而不是來自曲線在某個點的高度。這也是很多概率密度函數誤解的來源。
-   在投資與風險分析中，只要尊重模型邊界與估計誤差，概率密度函數可以把數據與假設轉化為可執行的輸出，例如尾部概率、VaR（Value at Risk）、ES（Expected Shortfall）以及情景區間範圍。

* * *

## 定義及背景

### 概率密度函數的含義（通俗解釋）

概率密度函數（常簡稱為 “PDF”）描述的是：概率如何在一個 **連續型** 隨機變量的可能取值上被 “分佈開來”。“連續型” 意味着變量在某個範圍內可以取無限多個值。例如，1 日股票收益率可以是 0.10%、0.11%、0.109% 等等。

概率密度函數通常記為 \\(f(x)\\)，並滿足 2 個性質：

-   不為負：\\(f(x)\\ge 0\\)
-   曲線下的總面積為 1：

\\\[\\int\_{-\\infty}^{\\infty} f(x)\\,dx = 1\\\]

### 為什麼 “看面積，不看高度” 很重要

對於概率密度函數，變量落在區間 \\(\[a,b\]\\) 的概率為：

\\\[P(a\\le X\\le b)=\\int\_a^b f(x)\\,dx\\\]

這一個公式解釋了概率密度函數在金融中多數正確用法：

-   你為收益或損失估計或假設一個概率密度函數；
-   你對關心的區域（某個範圍、某段尾部、壓力區間）做積分；
-   你把得到的面積解讀為概率。

因為 PDF 描述的是連續變量，落在任何一個精確點上的概率可以視為 0：\\(P(X=x)=0\\)。因此，\\(f(x)\\) 的 “高度” 本身不是概率。

### 概率密度函數概念的來源，以及金融為什麼在意它

概率密度函數來自經典概率論與微積分，在連續型分佈被嚴格形式化後成為標準工具。金融領域採用 PDF 的思路，是因為很多核心問題本質上是連續的：

-   收益與收益率變動常被建模為連續變量；
-   損失分佈需要關注尾部概率；
-   衍生品定價依賴某種假設或隱含的分佈，常用概率密度函數來概括。

在期權市場中，交易者常提到 “隱含分佈”。簡化來説，一組不同行權價的期權價格可以用於反推出未來價格的 _風險中性_ 分佈，並可用概率密度函數表達。這個概率密度函數並不等同於真實世界收益的預測，而是在風險中性測度下與定價一致的分佈。儘管如此，它仍常被用於情景討論與壓力溝通。

* * *

## 計算方法及應用

### 方法 1：從 CDF 推出概率密度函數（教科書式路徑）

如果你已知累積分佈函數 \\(F(x)=P(X\\le x)\\) 且它可導，那麼概率密度函數為：

\\\[f(x)=F'(x)\\\]

在實踐裏，投資者很少從已知的 \\(F(x)\\) 開始。更常見的是從數據估計 PDF，或假設某個分佈族（正態分佈、t 分佈等）並進行擬合。

### 方法 2：參數化擬合（先假設形狀，再估計參數）

常見流程是：

1.  選擇一個分佈族（正態分佈、Student’s t 分佈、偏度 t 分佈等）；
2.  用歷史數據估計其參數（常用極大似然估計）；
3.  用擬合後的概率密度函數計算概率、分位數或風險指標。

參數化 PDF 模型受歡迎的原因是簡單、速度快，且易於嵌入投研與風控系統。代價是模型風險：如果分佈形狀假設不對（尤其是尾部），基於 PDF 的輸出可能會誤導判斷。

### 方法 3：非參數估計（讓數據決定曲線形狀）

如果不想綁定某個分佈族，可以用核密度估計（KDE）等方法來估計 PDF。KDE 會生成一條平滑曲線，近似未知密度。

對投資者更實用的理解是：KDE 能反映歷史收益的偏度、多峯結構或不尋常形態。但它對參數設置（如帶寬）與樣本量敏感。

### 方法 4：變量變換（當你對收益或價格做變換）

金融中經常做變量變換：價格到對數價格、簡單收益到對數收益、收益率到價格等。若 \\(Y=g(X)\\) 且映射滿足常規條件，可使用變量變換公式：

\\\[f\_Y(y)=f\_X(x(y))\\left|\\frac{dx}{dy}\\right|\\\]

當你為某個口徑（例如對數收益）估計了 PDF，但需要以另一口徑（例如價格變動）表達概率時，這一點尤其重要。

* * *

### 應用：概率密度函數如何進入投資工作流

#### 1) 用於情景區間的區間概率估計

假設 \\(X\\) 為某指數 1 日收益率，你想計算：

-   “平穩日” 的概率：\\(P(-0.5\\%\\le X\\le 0.5\\%)\\)
-   “大跌日” 的概率：\\(P(X\\le -2\\%)\\)

用 PDF，這兩者都通過面積計算。相較只給出波動率，這更有信息量，因為波動率本身並不刻畫偏度與尾部厚度。

#### 2) VaR 與 ES（聚焦尾部）

很多風險指標可以用損失分佈表達，而損失分佈常由概率密度函數概括：

-   VaR（Value at Risk）是損失分佈的一個分位數；
-   ES（Expected Shortfall）是超過某個尾部閾值後的平均損失。

即便系統以數值方法計算 VaR 或 ES，其底層思想仍是基於 PDF：你在使用分佈的尾部面積。

#### 3) 衍生品定價與 “風險中性” 密度

期權價格包含市場對未來價格不確定性的定價信息。在常見框架下，不同行權價的期權價格與到期時標的的風險中性概率密度函數相關。

對投資者而言，關鍵的實務點是：市場隱含的概率密度函數可以用來討論 _在定價測度下市場在不同價格區間 “定價為更可能或更不可能”_，但不應被當作真實世界概率的直接預測。

#### 4) 壓力測試與狀態（regime）思維

單一 PDF 可能掩蓋狀態切換（如平穩期 vs 危機期）。更貼近現實的做法是對比不同階段的密度：

-   “平穩期” 樣本往往對應更窄的 PDF；
-   “危機期” 樣本往往對應更寬、尾部更厚的 PDF。

這種對比能提升風險溝通質量：與其給出一個波動率數字，不如展示整個分佈形態如何變化。

* * *

## 優勢分析及常見誤區

### 概率密度函數 vs 相關概念（何時用什麼）

理解相鄰概念有助於避免誤用。

概念

描述內容

典型金融用途

常見混淆

概率密度函數（PDF）

連續結果的 “密度”，概率來自面積

收益建模、損失尾部、期權隱含分佈

把高度當概率

PMF（probability mass function）

離散結果的概率

信用事件、違約/不違約、成交筆數

用 PMF 的規則處理連續數據

CDF

\\(P(X\\le x)\\)，單調遞增

分位數、VaR 閾值

忘記 CDF 本身就是概率

似然（Likelihood）

在給定數據下參數有多 “合理”

MLE 擬合、模型比較

不加先驗就把它當作參數的概率

### 使用概率密度函數的優勢

-   **對不確定性的緊湊表達：** 概率密度函數把位置、分散度、偏度與尾部放在同一個對象裏。
-   **天然適配尾部問題：** 金融裏很多問題是尾部問題，PDF 讓尾部面積一目瞭然。
-   **支持仿真與情景生成：** 有了 PDF（或擬合模型），可以進行模擬生成情景路徑。
-   **便於模型對比：** 你可以對比不同 PDF 形狀，並觀察尾部概率如何變化。

### 侷限與風險（可能出錯的地方）

-   **對假設敏感：** 正態分佈 PDF 若用於厚尾市場，可能低估崩盤風險。
-   **估計誤差：** 歷史樣本有限時，估計的 PDF 可能不穩定，尤其是尾部數據稀缺。
-   **精確感錯覺：** 平滑的 PDF 曲線看起來很 “精細”，但輸入可能很脆弱。
-   **非平穩性：** 金融收益分佈會隨時間變化，用某段時期估計的 PDF 未必適用於另一段時期。

### 常見誤區（以及如何糾正）

#### 誤區 1：“PDF 的函數值就是概率”

不對。連續變量的概率來自面積而非高度。\\(f(x)\\) 是帶單位的密度（例如 “每 1% 收益的密度”），不能直接讀成概率。

#### 誤區 2：“PDF 超過 1 就不合法”

PDF 可以超過 1，因為要求是 _整體積分為 1_，而不是每個點都小於 1。方差很小、分佈很集中的情況下峯值會更高。

#### 誤區 3：“不同單位下的 PDF 高度可以直接比較”

PDF 依賴計量單位：用小數表示收益 vs 用百分數表示收益，PDF 會隨尺度重標定。不統一單位就比較高度沒有意義。

#### 誤區 4：“擬合得好的 PDF 就能預測未來”

PDF 是在特定假設與樣本選擇下對不確定性的模型總結。它能輔助規劃與倉位風險，但無法消除狀態切換、結構性斷裂或流動性衝擊。

* * *

## 實戰指南

### 用概率密度函數做組合風險分析的分步流程

這是一套可用表格或統計工具落地的流程，重點服務於依賴區間與尾部的決策場景。

#### Step 1：選擇真正關心的變量與期限

示例：

-   組合 1 日收益
-   債券收益率 1 周變動
-   1 個月最大回撤（注意：回撤比簡單收益更復雜）

要明確口徑，因為日收益的 PDF 不能在沒有額外假設的前提下直接複用到月度結果。

#### Step 2：以 “風控視角” 清洗數據

-   使用一致口徑的收盤到收盤收益（或其他一致定義）。
-   記錄缺失值處理方式。
-   檢查極端點是數據錯誤還是真實事件。

未清洗的數據會製造虛假尾部或掩蓋真實尾部。

#### Step 3：至少估計 2 種 PDF（做模型對比）

實務上一個最低配置是：

-   一個簡單參數化 PDF（例如正態分佈或 t 分佈）
-   一個非參數 PDF（例如 KDE）

目標不是找出 “唯一正確” 的 PDF，而是理解結論對密度選擇有多敏感。

#### Step 4：問區間與尾部問題，而不是點概率問題

示例：

-   \\(P(X\\le -2\\%)\\) 是多少？
-   \\(P(-1\\%\\le X\\le 1\\%)\\) 是多少？
-   \\(P(X\\le -2\\%)\\) 在不同模型下如何變化？

這些問題與 PDF 的 “面積” 機制匹配。

#### Step 5：有意識地對尾部做壓力測試

如果決策依賴極端結果，應該測試更厚尾的假設。例如對比正態分佈 PDF 與 Student’s t 分佈 PDF。最大的差異通常出現在尾部概率上，而尾部概率會影響風控限額與回撤預期。

* * *

### 案例：用概率密度函數對比 “正態” 與 “厚尾” 的損失風險（合成示例）

這是 **僅用於教學的合成示例，不構成投資建議**。數字用於説明：PDF 假設會如何改變尾部結論。

#### 設定

你用以下假設建模某寬基股票指數的 1 日收益：

-   均值約為 0（為簡化忽略）
-   日波動率 1%

比較兩種 PDF 選擇：

-   模型 A：正態分佈，\\(\\sigma=1\\%\\)
-   模型 B：Student’s t 分佈，尺度相同但尾部更厚（常用於刻畫類似 “崩盤” 的行為）

#### 問題

1 日收益 **小於等於 -3%** 的概率是多少，即 \\(P(X\\le -3\\%)\\)？

-   在正態分佈 PDF 且 \\(\\sigma=1\\%\\) 下，-3% 相當於 -3 個標準差，左尾概率約為 **0.13%**（大約 770 個交易日出現 1 次）。
-   在厚尾 PDF 下，-3% 的概率可能更高（具體數值取決於自由度與尺度設定）。在貼近真實收益的擬閤中，常見情形是尾部概率與正態假設相比存在明顯差異。

#### 為什麼重要

類似 “我們可以承受每隔幾年出現一次 -3% 日跌幅” 的風險規則，本質上依賴尾部面積。如果 PDF 假設過於薄尾，你可能低估大虧發生頻率，從而設定過於樂觀的風險限額。

#### 實務要點

當決策依賴尾部結果時，不要只依賴一條 PDF 曲線。至少對比一種薄尾與一種厚尾設定，並把差異視為需要管理的模型風險。

* * *

## 資源推薦

### 建立概率密度函數直覺的學習方向

-   **概率與統計入門：** 重點掌握連續分佈、CDF 與 PDF 的關係，以及基於積分的概率計算。
-   **時間序列與計量經濟學：** 理解收益分佈為何會隨時間變化、波動率聚集，以及平穩性假設對 PDF 的影響。
-   **風險管理：** 學習損失分佈、分位數與尾部風險指標，理解 PDF 如何進入制度化決策。
-   **衍生品與期權定價：** 理解分佈在定價中的作用，包括期權價格隱含的風險中性概率密度函數思想。

### 可遷移到投研/風控工作的練習建議

-   對同一條收益序列擬合 2 種不同的 PDF，並對比尾部概率。
-   在兩個不同窗口（平穩期 vs 高波動期）估計 KDE PDF，比較密度形狀如何遷移。
-   使用概率積分變換（PIT）或 QQ 圖檢查你的 PDF 是否系統性低估或高估尾部。

### 展示概率密度函數時建議記錄的信息

-   數據頻率與期限（每日、每週、每月）
-   樣本區間（以及選擇理由）
-   模型選擇（參數分佈族或 KDE 設定）
-   已知限制（樣本小、狀態切換、低流動性階段等）

這些記錄往往比曲線本身 “看起來多平滑” 更重要。

* * *

## 常見問題

### 如何用最簡單的話解釋概率密度函數？

概率密度函數是一條用於連續變量的曲線：某個範圍內的概率等於該範圍下曲線的面積。不要把曲線上某個點的高度當作概率。

### 概率密度函數可以大於 1 嗎？

可以。PDF 可以超過 1，只要對全域積分的總面積等於 1 即可。分佈越集中，峯值可能越高。

### 如何從概率密度函數計算實際概率？

對區間做積分：

\\\[P(a\\le X\\le b)=\\int\_a^b f(x)\\,dx\\\]

實務中通常由軟件通過 CDF 或數值積分完成。

### 為什麼連續變量有 \\(P(X=x)=0\\)？這會讓 PDF 沒用嗎？

連續變量的概率分散在無限多個點上，所以精確落在某一點的概率為 0。但現實問題通常是區間問題，例如 “在 -1% 到 0% 之間” 或 “差於 -2%”，因此 PDF 依然非常有用。

### 從期權得到的市場隱含概率密度函數，是對未來收益的預測嗎？

不一定。它通常被理解為與期權價格一致的 _風險中性_ 概率密度函數，用於定價而非預測真實世界概率。它仍可用於情景討論，但不應當作確定性的預測。

### 投資者在看 PDF 圖時最常犯的錯誤是什麼？

把兩個點的高度直接比較並當作 “更可能”，但沒有把它轉換為區間概率，也沒有檢查單位、KDE 帶寬或模型假設是否改變了 PDF 的尺度。

* * *

## 總結

概率密度函數為連續型金融變量的不確定性提供了一種清晰表達：把 “未知的未來結果” 轉化為可計算的結構，使概率通過面積來衡量。用得好，概率密度函數能支持區間思維、尾部風險度量與基於模型的情景分析；用得不當，則容易帶來 “看似精細” 的錯覺，尤其當把曲線高度誤當概率，或用薄尾假設處理厚尾市場時。更穩健的做法是把任何概率密度函數都視為決策輔助工具：對比多個合理的密度模型，聚焦真正驅動風險結果的尾部面積，並完整記錄假設與限制，確保在市場狀態變化時結論仍可解釋、可複核。
