結論:PMFは「離散」、PDFは「連続」の確率分布を表す
確率質量関数(PMF: Probability Mass Function)はサイコロの目のように離散的な値の確率を、確率密度関数(PDF: Probability Density Function)は身長のように連続的な値の確率を表します。両者は名前が似ていますが、扱う対象と数学的性質が大きく異なります。
この記事で分かること
- PMFとPDFの定義の違い
- 離散分布と連続分布の例
- グラフの読み方の違い
- 累積分布関数(CDF)との関係
- 確率計算での使い分け
1. 確率質量関数 (PMF)
離散確率変数 X に対して、P(X=x) を返す関数。値そのものが確率を意味します。
例: サイコロの PMF
P(X=1) = P(X=2) = ... = P(X=6) = 1/6
合計: Σ P(X=x) = 1
2. 確率密度関数 (PDF)
連続確率変数に対して、確率の「密度」を返す関数。値自体は確率ではなく、区間で積分した値が確率になります。
性質
f(x) ≥ 0、∫f(x)dx = 1
P(a ≤ X ≤ b) = ∫ab f(x)dx
P(X = 特定の値) = 0(連続なので)
3. 主要な離散分布(PMFを持つ)
| 分布 | 用途 |
|---|---|
| 二項分布 | N回試行中の成功回数 |
| ポアソン分布 | 単位時間のレアイベント数 |
| 幾何分布 | 初めて成功するまでの試行回数 |
| 超幾何分布 | 非復元抽出の成功数 |
4. 主要な連続分布(PDFを持つ)
| 分布 | 用途 |
|---|---|
| 正規分布 | 身長・テスト・自然現象 |
| 指数分布 | 寿命・待ち時間 |
| 一様分布 | 完全ランダム |
| ガンマ分布 | 統計モデリング |
5. 累積分布関数(CDF)との関係
CDF(Cumulative Distribution Function)は「X以下になる累積確率」。PMFとPDFの両方から計算可能。
- 離散: CDF(x) = Σk≤x PMF(k)
- 連続: CDF(x) = ∫-∞x PDF(t)dt
6. なぜPDFは確率そのものではない?
連続変数で「ぴったりx=170cm」の確率は0です(無限に多くの値があるため)。だからPDFは「密度」(単位長あたりの確率)として定義され、区間積分で確率を計算します。
7. PMFとPDFの直感的な違い
- PMF: 棒グラフのような形(離散点の高さ=確率)
- PDF: 滑らかな曲線(区間の面積=確率)
8. Excelでの計算関数
- 二項分布 PMF:
BINOM.DIST(x, n, p, FALSE) - 正規分布 PDF:
NORM.DIST(x, μ, σ, FALSE) - 累積分布 CDF: 第4引数を
TRUEに
9. 確率密度の値が1を超えることはある?
あります。PDFの値は密度なので1を超えてもOK。重要なのは積分(面積)が1になること。
よくある質問
Q. PDFとPMFのどちらを覚えるべき?
A. 両方覚えることをおすすめします。確率変数が離散か連続かで使い分けるため、両方の概念が必要です。
Q. 離散と連続の境界線は?
A. 扱う値の集合が可算(整数値・限られた選択肢)なら離散、実数値で無限に細かく区切れるなら連続。サイコロ・コインは離散、身長・時間は連続。
Q. ガチャ確率はPMFですか?
A. PMFです。『N回試行中に成功 k回』の確率は二項分布の PMF で表現します。
Q. Pythonでこれらを扱うには?
A. scipy.stats モジュールが標準。binom.pmf(k, n, p) で二項分布、norm.pdf(x, μ, σ) で正規分布が計算できます。
Q. 逆関数(分位点関数)は何?
A. CDF の逆関数で、ある累積確率に対応する値を返します。例: 上位5%の境界値を求めるなど。Excel では NORM.INV、Python では norm.ppf。
まとめ
この記事のポイント
- PMF(確率質量関数)は離散・PDF(確率密度関数)は連続
- PMFの値=確率、PDFの値=密度(区間積分で確率に)
- PDFは値が1を超えても構わない(積分が1)
- ExcelはBINOM.DIST/NORM.DISTで計算可能
- 二項分布はPMF、正規分布はPDF
この記事の監修者
確率計算シミュレーター編集部
統計学・確率論の専門知識を持つ編集チームが、正確で信頼できる情報を提供します。すべての記事は数学的に検証済みで、出典を明記しています。
監修者プロフィールを見る