ヒストグラムは3ステップで作成!作成から解釈までを徹底解説!

  • このエントリーをはてなブックマークに追加

・ヒストグラムから何がわかるの?

・ヒストグラムの作り方がわからない・・・

・そもそも、何で統計が必要なの?

 

私の元に、ヒストグラムの質問が寄せられることが多いです。

確かに、サイトの方ではヒストグラムに関して何も記事を載せていませんでした。

そのため、今日はヒストグラムを徹底解剖します!

専門用語をほとんど使っておらず、計算式もないので、本当に分かりやすいです!

ぜひ勉強して、皆さんの実務にお役立てください!!

 

生データを見てもわからないから統計を使う!

私たちは、日常的に多少なりともデータを扱っています。

商売を営んでいるなら、売り上げや仕入れ値や経費のデータを。

学生なら、テストの成績データが進学や卒業に関係する重要なデータです。

また、サラリーマンであれば、毎年の健康診断のデータも、今後の健康を左右する大事なデータです。

しかし、データは生のまま(単純な数字の羅列)ではそこから何も見出せません。

生のデータは単なる「事実」を示しています。

ただ、事実からだけでは何も生まれません。

そこで私たちは、生のデータを他のデータと比較したり、生のデータを加工したりして、何かしらの示唆を得ようとするのです。

下表は、50人分の大学生の男子の身長(cm)データです。

このデータを見て、何かを引き出せるでしょうか?

結構難しいですね。

 

数字はみんな同じなの?

ですが一つだけ言えることがあります。

それは、「身長は全員同じではなく、バラバラの数値をとっている」ということです。

すーーーーっごく当たり前のことを言っています。

ですが、すーーーーーっごく大切なことです。

この「バラバラの数値をとっている」ということから、「よし、統計を使ってみよう!」ということになるからです。

ちなみに、バラバラの数値を取っていることを、専門用語で「分布する」と言います。

 

さて、もうちょっと50人のデータを見てみると、もう一つ言えることがありそうです。

それは「バラバラだけど、ある数値の周辺でバラバラになっていそうだ」ということです。

つまり、100センチ以下の身長の人は一人もいないし、200センチを超える人もいませんよね。

そして、なぜか160センチ〜180センチぐらいの間でバラバラしてそうです。

そう、バラバラな中にも上記のような「特徴」がありそうです。

この特徴を専門用語で「分布の特性」と言います。

 

闇雲にバラバラしているわけではない!

つまりデータは「何らかの特徴を持った上でバラバラしている」

ということが言えます。

これを知ったあなた!

本当に、このページを見た甲斐があります。

なぜなら、この事実を知った上でデータを扱うのと、知らずにデータを扱うのとでは、理解度に雲泥の差が出て来るからです!

 

そして、その「特徴」が何なのかなー、というのを調べるために統計を使うのです。

つまり、「データとして並んでいるたくさんの数字を、何かの基準で整理整頓して、意味のある情報を取り出してあげる」ということをする。

そのために、2つの方法が考えられます。

  1. グラフ化してその特徴を捉える
  2. 1つの数字で特徴を代表させる(→この代表する数字を統計量と言います。)

「ヒストグラム」は1つ目の方法である「グラフ化してその特徴を捉える」という方法に最も合致した図式化方法なのです。

 

 

ヒストグラムって何だ?作り方がわかると読み取り方もわかる!

ヒストグラムはデータの特徴を捉えるのに最適な図式化方法であることを解説しました。

じゃあ、ヒストグラムを作ってみよう!

というのがここでのミッションです。

なぜなら、作り方がわかると、ヒストグラムの意味やどこまで特徴がわかるのか、といった読み取り方がわかるようになるからです。

 

ちなみに、こうやって無料で統計のことを発信していますが、それによって一番知識がついているのが、何を隠そう私です!!www

なぜなら、人に伝えるためには、分かりやすく伝える必要がありますよね。

そのためには、わからない部分があってはいけない。

つまり、何かしら身に付けたい場合には、それをアウトプットしてみることが大事です。

ヒストグラムを知りたければ、ヒストグラムをアウトプットしてみることが大事。

つまり、ヒストグラムを実際に作ってしまう、ということが大事になるのです。

 

ヒストグラムってこういうもの!

答えから言うと、ヒストグラムはこういうものです。

さっきの、50人のデータをヒストグラムにしています。

横軸が階級(データを小区間で区切ったもの)で、縦軸が度数(人数)です。

つまり、階級と度数の二つがあればヒストグラムはできるってことです!

では階級と度数の二つ用意すると決まったので、実際に作ってみましょう!

 

たった3ステップでヒストグラムを作成!実際の作り方

生データからヒストグラムを作るまでには、3ステップでできます。

作成時間は2分です。

(実際に、さっきのヒストグラムを作るのに2分かかりましたww)

エクセルに慣れている人なら1分かからないのでは?と思います。

 

Step1: データから一番大きい数値(最大値)と一番小さい値(最小値)を確認する

Step2: おおよそ範囲が最大値と最小値になるような範囲を決め、それを5~8の小区間に区切る(これを階級と呼びます)

Step3: 各階級に入るデータの数をカウントする(これを度数と呼ぶ)

 

なにも難しいことはありません。

3回ぐらい作ったら、もう何も見なくても出来るようになるでしょう。

 

 

ヒストグラムから何がわかる?特徴を読み取ってみよう!

さて、あなたが丹精込めて作ったヒストグラム。

ここから何がわかるでしょうか?

もう一度ヒストグラムを再掲してみます。

 

実は二つの特徴が見えて来るのです。

 

特徴その1:

身長は全ての階級に均一に(一様に)分布しているのではなく、ある場所に(具体的には170-175センチの間に)データが集中している

特徴その2:

集中している場所を起点にして、そこから低い階級に向かっても高い階級に向かっても、同じように度数が減っていく。

つまり、集中している場所を起点にして対称性がありそう。

 

つまり、ヒストグラムを作ることによって以下の3つの特徴がわかったのです。

  1. どんな数値も可能ではなさそう。
  2. ある身長の付近にデータが集中する。
  3. 集中した部分から、左右対象に度数が減っている。

 

このような特徴は、生データをみると全くわからなかった特徴です。

つまり、統計を使うことによって、細部は犠牲にするが、データの特徴を浮き彫りにしてくれるのです。

 

まとめ

生データを見ただけではわからない。

だが、統計を使うことで、データの特徴をつかむことができる。

ヒストグラムは3ステップで作成可能であり、データの特徴を視覚として捉えることができる。

男子大学生の身長を例にすると、以下の特徴が見える。

  1. どんな数値も可能ではなさそう。
  2. ある身長の付近にデータが集中する。
  3. 集中した部分から、左右対象に度数が減っている。

 

どうでしたか?

この記事があなたの疑問を解決したなら嬉しいです!

 

 

 

メルマガ登録しますと、統計の知識を動画で解説しています。

世界中探しても、ここまで動画で統計を解説しているサービスはありません。

文字だけではどうも理解することが難しい、といったような方はぜひメルマガにご登録ください。

無料で登録できます。

今ならメルマガ登録の無料特典として以下の3つの資料を進呈しております。

1.イメージでとらえる統計学

2.イメージでとらえる推定

3.イメージでとらえるP値

ぜひご登録ください。

https://maroon-ex.jp/fx46970/oQ2DkN

 

  • このエントリーをはてなブックマークに追加

もう、自力で統計を学ぶことを諦めていませんか?

・このデータを解析するにはどうすればいいのか・・・

・今日から使える統計が知りたい・・・

・解析してみたけど、解析方法が正しいか不安・・・

・P値が0.05より小さいから、有意!・・・でいいよね・・・

・この研究成果を論文に出したいけど、解析が不安・・・

・数式だらけで、統計を理解できる気がしない・・・

・今日から使える統計はないものか・・・

 

そんなあなたに朗報です!

もう、今日から統計で悩まない。

自分での統計学習を諦めない。

そんなメルマガがあります。

 

文字で理解するのは限界があるので、動画で統計を解説したメルマガ。

このサイトの記事とセットで見たら、効果は倍増!

是非ともチェックしてみてください。

 

無料です。

 

今まで知らなかった、統計の世界。

どうぞ、体験してください。


新しい扉をクリック!

SNSでもご購読できます。

コメントを残す

*