読み方も意味しているところも分かりにくい尤度(ゆうど)。
わかりやすく解説。
尤度と似ている確率とは何か?
まず尤度は確率に似ているものだが、確率とは違う。
まず確率とは何かを、尤度との対比になるような説明を紹介したい。
統計学で考える場合、例えば正規分布しているデータが発生する確率というふうに考える。
この場合、正規分布の母数(パラメータ)として、母平均と母標準偏差(母分散の平方根)が決まっている。
このとき以下のように考えて記述する。確率は英語でProbabilityなので、Pr と書くことがよくある。| は、その右側のものが得られているときという条件を表している。
$$ Pr (データ | 母平均, 母標準偏差) $$
つまり、パラメータが決まっているうえでのデータが発生する確率という記述、言い方、考え方になる。
例えば、偏差値は、平均が50、標準偏差が10の正規分布であるが、このとき偏差値70以上になる確率は、母平均が50、母標準偏差が10とみなしたときの正規分布上の確率という形で計算する。答えは0.023=2.3%である。
> pnorm(q=70, mean=50, sd=10, lower.tail=FALSE)
[1] 0.02275013
尤度を確率と対比するとどうなるか?
尤度は確率と逆の発想と言える。
尤度は、まず取得したデータから物事を考え始める。
あるデータが得られたときに、どんな母数であると、このデータが尤もらしい(もっともらしい)だろうかという度合いが尤度である。
尤度は英語ではLikelihoodと言われるので、L と書くことがよくある。確率の時と同じく正規分布であることを想定すると以下のように記述できる。
$$ L (母平均, 母標準偏差 | データ) $$
つまり、データが得られたうえで、ある母平均や母標準偏差とすると、このくらい尤もらしいという記述、言い方、考え方になる。
尤度はどんなことに役立つのか?
尤度はどんなことに役に立つのだろうか?
尤度はデータの尤もらしさなので、尤もらしさを最大化することが求められるのは想像しやすい。
尤度を最大にするパラメータを探す方法を、最尤(さいゆう)推定法といい、最尤推定法で求められた推定値を最尤推定量と言う。
最尤推定法では、対数尤度(log likelihood, ln L または単に l(小文字のエル))を使うことが多い。対数をとると計算がしやすくなるからだ。
尤度はデータ1が得られたときの尤度、データ2が得られた時の尤度・・・とすべてのデータにおける尤度を掛け算して計算している。その掛け算を足し算にすることができるのが対数変換である。
対数変換した尤度を、パラメータごとに対して偏微分し、その関数がゼロになる点が、まさに尤度が最大となる点であり、その時のパラメータが求める推定値である。
このように分布やモデルのパラメータを推定することに使っている便利な考え方なのである。
まとめ
尤度とは何かを確率との対比で紹介し、どんなことに役立っているかを説明した。尤度の理解が少しでも進めば。
参考動画・参考スライド
英語ではあるがとてもわかりやすい動画がある。参考まで。
最尤推定量や尤度について、日本語で簡潔に説明しているスライドも参考にした。スライド7枚目から。
コメント
コメント一覧 (4件)
大学の統計学で急に尤度というワードが出てきて、犬度と間違えるレベルだったところ、この記事を見つけられました。尤度とはを一言で説明してくださった他、記事が長すぎず分かりやすいです。そして微分して最大値を求める形で尤度を推定するという説明で、尤度を考える目的も分かりました。ありがとうございます!
これからデータを扱って、よりしっかり理解したいです。
コメントをありがとうございました!お役に立てたようでうれしいです!
[…] 尤度とは?わかりやすく解説 読み方も意味しているところも分かりにくい尤度(ゆうど)。 […]
[…] 尤度とは?わかりやすく解説 読み方も意味しているところも分かりにくい尤度(ゆうど)。 […]