確率密度関数とよくセットで出てくる、累積分布関数。
確率密度関数と累積分布関数は何が違うのでしょうか?
確率密度関数と累積分布関数はどういった関係なのでしょうか?
そして累積分布関数はどうやって求めることができるのでしょうか?
この記事では、累積分布関数について解説し、エクセルで求め方について解説していきます。
累積分布関数とは?確率密度関数との違いは何?
累積分布関数は確率変数がある値以下になる確率を表した関数です。
例えば、正規分布の累積分布関数を可視化すると、下のようになります。
累積分布関数は確率変数がある値以下になる確率を表した関数です。
そのため、横軸は確率変数を、縦軸は確率を表しています。
これが、確率密度関数とは大きく違うところです。
確率密度関数と累積分布関数の違い
確率密度関数では、ある区間の面積が確率になるというのを、確率密度関数とは?正規分布一様分布の面積が確率になり離散値ではどうなる?で見ました。
確率密度関数では縦軸は確率密度を表しています。
一方の累積分布関数の縦軸は確率を表しています。
このポイントが累積分布関数と違うところです。
- 確率密度関数の縦軸は確率密度
- 累積分布関数の縦軸は確率
関数を見たときに混乱しないように気をつけましょう。
グラフを見たら、一発でわかりますよね。
以下のグラフが標準正規分布の確率密度関数のグラフです。
累積分布関数の縦軸が確率ということは、全ての確率を足し合わせたら1になる、という性質があるので、グラフの右端は1になっているはずです。
そうやって見分けましょう。
確率密度関数と累積分布関数の関係
正規分布をはじめとした確率密度関数は、下の図のように、ピークがあり、ピークから離れるほど0に漸近するという分布を持ちます。
>>>正規分布とは?簡単にわかりやすく標準偏差との関係やエクセルでのグラフ化を解説
この確率密度関数のルールは、確率変数の全範囲の面積が1となるということでしたね。
そのため、-∞からある範囲までの面積を求めていくと、最終的には1になります。
累積密度関数は確率変数の全範囲の面積が1となることを表したものです。
正確に述べるのであれば、連続型確率変数では、負の無限大から x までの確率密度関数を定積分したもののことを指します。
上の図でも、横軸の確率変数が大きくなるにつれて1にだんだんと近づいていっていますね。
累積分布関数では、ある値までの累積の確率を表したものです。
そのため、ある値以下になる確率が、縦軸に対応します。
標準正規分布では0が最頻値で、-∞から0までの範囲が全体の0.5 (50%)になるというのを見ました。
>>>標準正規分布表の見方について!標準化やZ値の計算式はどうすればいい?
正規分布の累積密度分布では、0のところで0.5(50)%になっていますね。
離散確率変数のときでも、累積分布を考えることができます。
例えば、サイコロの目の確率は1/6です。
2以下の目が出る確率は、2/5、5以下の目がでる確率は5/6といったように、累積分布を求めることができあます。
また、6以下の値が出る確率は6/6で1と、どれかの値が出る確率は1になります。
上の図では、横軸は確率変数、青が累積分布、オレンジが確率分布を表しています。
確率密度関数の用途
累積分布関数は確率変数がある値以下になる確率を表した関数でした。
一方で、正規分布のような左右対称の確率密度分布では、逆にある値以上になる確率も表すことができます。
確率密度関数は、例えば試験の成績などで上位何%かまたは、下位何%かなどを知るときに用いることができます。
例えば、難関大学受験などでは、試験の結果は正規分布にしたがったとしても、合格するのは定員までの上位の受験者です。
このようなときに、上位何%が合格できるかといった問題を解くのに、確率密度関数を用いることができます。
また、様々な分布の性質を知る時も、確率密度関数を描くことがあります。
エクセルでの正規分布の累積分布関数の求め方
正規分布の累積分布関数はExcelでも簡単に求めることができます。
関数は、正規分布と同じ関数のNORM.DISTです。
>>>正規分布とは?簡単にわかりやすく標準偏差との関係やエクセルでのグラフ化を解説
NORM.DISTの書き方は、
=NORM.DIST(確率変数, 平均, 標準偏差, 出力形式)
です。
確率変数、平均、標準偏差は数字を入れてください。
あとは、出力形式を選択します。
出力形式をFalseにすると、正規分布の確率密度関数になります。
累積分布関数はTrueを選択してください。
これが、実際の関数です。
平均が0で、標準偏差が1、出力形式がTRUEなので、
標準正規分布の累積密度関数を書くことができます。
例えば、確率変数の数列を作成し、
=NORM.DIST(セル名, 0, 1, TRUE)
を用いることとで、累積密度分布のグラフを作図することもができます。
累積分布関数は式で表すことはできますが、複雑な式になります。
累積分布関数とは?まとめ
- 累積分布関数は確率変数がある値以下になる確率を表した関数
- 確率密度関数では縦軸は確率密度を表す
- 一方の累積分布関数の縦軸は確率を表す
- 正規分布の累積分布関数はExcelでは正規分布と同じ関数のNORM.DISTで、出力形式をTrueで描くことができる
累積分布関数と確率密度関数の関係について説明しました。
統計では、累積分布関数から派生した検定なども考案されています。
コメント