標準偏差を求める関数がエクセルで2つある!?使い分けとグラフ化を完全解説!

・Excelで標準偏差を求めるのに関数が2つあるんだけどどう使い分けるんだろう?

・そもそも分散と標準偏差ってどう違うの?

・グラフを作るときに標準偏差をエラーバーとして出したいんだけどそれはどうやって出せばいいの?

 

あなたはそういった疑問を持っていませんか?

統計をやっていると最初につまずくのはこの標準偏差ではないでしょうか。

ですが標準偏差は統計を理解するにあたって、避けては通れません。

さらに標準偏差があることで、統計を使う意味があると言っても過言ではありません。

そのぐらい大切な標準偏差を、この記事では数式をほぼ使わずにわかりやすく解説しています。

 

広告

この記事を読めばわかるようになること

この記事を読めば、これだけのことがわかるようになります!

1. 母集団と標本の違い。
2. 標準偏差に関して、Excelでの関数の使い分け方
3.分散と標準偏差の違い
4. 棒グラフでのエラーバーの出し方

 

Excelで標準偏差を出すのになぜ関数が2つあるのか?

Excelで標準偏差を出そうとすると関数が2つ用意されていることに気づきます。

1つはSTDEV.P

もう1つはSTDEV.S

この二つは、一体どのように使い分ける必要があるのでしょうか?

 

母集団と標本を復習!

実はこの2つの関数は母集団と標本の違いを表しています。

母集団と標本の違いに関してはこちらの記事を参照してください。

母集団と標本

 

といってもここでも少しだけ復習しましょう。

 

まずは標本の解説です。

標本とはあなたが扱うデータのことを標本と呼びます。

例えばあなたが50人の小学6年生の身長を集計したいとします。

その時の50人の小学6年生が標本です。

 

一方で母集団とは。

母集団とはその標本がピックアップされる元となる集団のことをいいます。

例えば日本全体の小学6年生の身長を調べたいという目的で50人の小学6年生が標本を調べたとします。

その場合には日本全体の小学6年生が母集団にいます。

では世界全体の小学6年生の身長を調べたいという目的で50人の小学6年生の標本を調べたとしたらどうでしょうか?

その場合には母集団は世界全体の小学6年生です。

ちょっとくどいですが、東京都の小学6年生を調べたいと思って50人の小学6年生の標本を調べていたとしたら母集団はどうなるでしょうか?

そうですね。

東京都の小学6年生全体が母集団になります。

つまり図式化すると以下のようになります。

母集団から標本を選ぶことを統計の中では抽出と呼びます。

標本から母集団を調べることを統計の中では用語として推定と呼んでいます。

 

エクセルでの2つの関数の使い分けは?

母集団と標本の関係はわかりましたね。

ではExcelで標準偏差を求めるのになぜ2つの関数があるかということです。

母集団と標本の関係さえわかっていればここは難しくありません。

1つ目の関数STDEV.Pは母集団の標準偏差を推定するための関数です。

もう一方のSTDEV.Sは、標本の標準偏差、つまりあなたが扱っているデータの標準偏差を求める関数になります。

例えば東京都の小学6年生を母集団として、50人の小学6年生の身長のデータを扱っていたとします。

東京都の小学6年生の標準偏差を求めたい場合にはSTDEV.Pを使います。
50人の小学6年生の身長の標準偏差を求めたいときにはSTDEV.Sを使います。

 

2つの関数の覚え方は?

2つの関数は、最後の文字がPかSかの違いでした。

いざ使うときに、どっちが母集団の標準偏差で、どっちが標本の標準偏差だっけ?

と混乱しそうですよね。

でも、PとSがなんの略かを知っていれば、混乱することはないでしょう!

 

覚え方としては、以下の通り。

 

Pは、Populationの略。Populationは日本語にすると「母集団」です。
Sは、Sampleの略。Sampleは日本語にすると「標本」です。

 

 

エクセルのバージョンの違いによる関数の違いはどうなっているのか?

エクセルの厄介なところ。

それは、バージョンによって若干、関数の形が異なっていることです。

標準偏差の関数に関しては、Excel2007以前と、Excel2010以降で形が異なるようです。

 

Excel2007より前のバージョンを使っているあなた

母集団の標準偏差を求める関数は「STDEVP」です。

標本の標準偏差を求める関数は「STDEV」です。

 

Excel2010より後のバージョンを使っているあなた

今まで解説していた通り、以下の関数です。

母集団の標準偏差を求める関数は「STDEV.P」です。

標本の標準偏差を求める関数は「STDEV.S」です。

 

 

分散と標準偏差の使い分けはどうなっているの?

分散と標準偏差は2つともデータのばらつきを表す指標です。

ではその使い分けはどうすれば良いのでしょうか。

分散と標準偏差の関係はこのような関係ですね。

 

つまり分散をルートすれば標準偏差になります。

標準偏差を2乗すれば分散になります。

 

ではなぜこのような2つの指標があるのでしょうか?

実は数式としては、平均値から分散が直接求まります。

そう、最初に計算できるのが分散なのです。

 

分散で困ること

ですが分散だと1つだけ困ったことがあります。

それは単位が元のデータの2乗になっているということです。

 

例えば、身長のデータを扱っているときに元のデータはセンチメートルですよね。

すると分散はセンチメートルの2乗の単位を持っています。

では平均値はどのような単位を持っているでしょうか?

データと同じ単位を持っています。

つまりセンチメートルと言う単位を平均値は持っています。

すると厄介なことがおこりますね。

平均値はセンチメートルと言う単位を持っているのに、ばらつきを表す分散はセンチメートルの2乗という単位を持っています。

もしかしたらあなたは、ただ2乗しただけでそれほど違いは無いじゃないか、と思うかもしれません。

ですが、この2乗と言うものはとても大きな意味があります。

センチメートルとセンチメートルの2乗の違いは、センチメートルとキログラムの違いぐらい違うということが言えます。

そうなるとやはり、データのばらつきを示す指標としては分散のルートを取る標準偏差が最適です。

 

エクセルの棒グラフにエラーバーを出そう!

では実際に、エクセルを使って棒グラフに標準偏差のエラーバーを出してみます。

こちらの記事で使ったデータを今回も使ってみますね。

乱数を用いて、正規分布のグラフをエクセルで描いてみる。たったの3ステップ!

 

まずは、平均値と標準偏差を求める

まずは、平均値を求めます。

エクセルでの平均値を求める関数は「Average」です。

その次に、標準偏差です。

ここでは、標本の標準偏差を求めます。

そう、STDEV.Sですね。

 

棒グラフを選択する

平均値と標準偏差を出したので、グラフを書く準備ができました。

なので、棒グラフを選択します。

 

 

標準偏差をエラーバーとして出力する。

そして、今回のメインのエラーバーを出してみましょう。

グラフを選択すると、左上に「グラフの要素を追加」という部分があります。

そこを選択して、「誤差範囲」→「その他の誤差範囲オプション」を選択します。

 

 

そうすると、右側に設定を選択できる画面が出てきます。

そこで「誤差範囲」を「ユーザー設定」にして「値の選択」をクリックします。

 

そうすると、誤差を何にするかが指定できるようになります。

なので、今回は標準偏差を出力したG2のセルを選択します。

 

エラーバーが出力された!

すると、このようにエラーバーを持つ棒グラフができました。

 

まとめ

エクセルでは、2つの標準偏差を求める関数が用意されています。

使い分けは、母集団の標準偏差を求めたいのか、それとも標本の標準偏差を求めたいのか、によって異なります。

母集団の標準偏差を求める関数は「STDEV.P」で、標本の標準偏差を求める関数は「STDEV.S」です。

棒グラフに標準偏差をエラーバーとして出力する方法も学びました。

統計検定2級の解説付き

無料動画の統計授業

 

 

無料動画で統計を学びませんか?

 

・この数式、何を言っているのか全くわからない・・・ 

・統計を学びたいけど、何から手をつけていいのだろう・・・

・統計検定2級を受験したいけど、どう勉強したら・・・

・もう自力で統計を学ぶのに疲れました・・・

 

あなたはそんな悩みを抱えていませんか?

大丈夫です。

最後の手段があります。

どこにもない、統計の無料メールセミナー。