いろいろなデータをわかりやすく伝えるために欠かせないグラフ。
しかし、グラフにはいろいろな種類があり、どういったときに、どのグラフを使えばいいのかわからない!
といったことはありませんか?
- 棒グラフ
- 円グラフ
- 帯グラフ
などなど、複数のグラフはあるけど、いまいち手元のデータに最適なグラフがわからない。。
そんなあなたに向けて、この記事では統計データの可視化によく用いられるグラフの種類と、目的に応じたグラフの使い分けについてわかりやすく説明していきます。
グラフの種類はどれだけある?どうやって使い分けるのか?
統計データの可視化で用いるグラフにはいろいろな種類があります。
これらのグラフは何を見せたいのか、何を強調したいかによって使い分ける必要があります。
今回は、
- 値の大小を見せたい
- 全体の中の割合を見せたい
- データのばらつきを見せたい
- データの相関関係を見せたい
ときに用いるグラフについて解説します。
今回は、これらの目的にあったグラフの種類について紹介していきます。
グラフの種類1:値の大小を見せたいときは棒グラフと折れ線グラフ
データの値の大小関係を見せたいときに使うグラフには、
- 棒グラフ
- 折れ線グラフ
を用います。
例えば、T検定などを用いて母集団の平均の有意差の検定をしたとき。
検定結果を視覚化するときに用いますよね。
そのような場合には、棒グラフや折れ線グラフが効果的です。
棒グラフ
棒グラフは、様々なところで用いられる馴染みの深いグラフです。
棒グラフはカテゴリー間での、値の大小関係を表すのに用います。
横軸にカテゴリーを、縦軸にはデータの値を用います。
T検定など、母集団の平均を比べるときなどは、棒グラフがよく用いられています。
>>> T検定とは?帰無仮説と対立仮説を必ず確認!F検定で等分散の確認が必要?
T検定など、データのばらつきがある場合はエラーバーで標準誤差や標準偏差を表現します。
>>>標準偏差と標準誤差の違いをわかりやすく!グラフでの使い方とサンプル数についても
折れ線グラフ
折れ線グラフもグラフといえば、というくらいお馴染みのグラフですね。
折れ線グラフも値の大小関係を表すのに用いますが、特に、横軸が連続した変数のときによく用います。
例えば、時系列で変化する値や、濃度や温度などによって変化する値の大小を見せたいときによく用います。
グラフの種類2:全体の中の割合を見せたいときは円グラフと帯グラフ
全体の中の何%かといった、割合の情報を見せたいときは、
- 円グラフ
- 帯グラフ(積み上げ棒グラフ)
を用います。
分割表の検定などを視覚化する時も、これらのグラフを用いたりします。
>>>分割表とは?例を使ってわかりやすく!2つの検定も理解しよう
円グラフ
円グラフは、円周一周を100または1として、割合を表すグラフです。
パイチャートと呼ばれたりもします。
円グラフはときに一つのデータについての割合を表現するときに使います。
複数のデータ間の比率を比較するには、円グラフでは見にくいため、帯グラフを用います。
帯グラフ (積み上げ棒グラフ)
複数のデータ間の比率を比較するには、円グラフでは見にくいため、帯グラフを用います。
また、帯グラフには、縦軸が比率のものと、縦軸が実際の値のもののの二種類が存在します。
割合を見せたいか、実際の量を見せたいかで使い分けます。
縦軸が割合の帯グラフ 。
割合に注目したいときに用います。
縦軸が実際の値、上の図では人口の帯グラフ。
比率よりも実際の値に注目したいときに用います。
グラフの種類3:データのばらつきを見せたい時はヒストグラムや箱ひげ図など
データのばらつきや分布を見せたいときには、
- ヒストグラム
- 箱ヒゲ図
- バイオリンプロット
- スワームプロット
などを用いると有効。
統計では、正規分布や二項分布といった様々な分布が出てきます。
上記のグラフは、実際のデータがどのような分布にしたがっているかを調べたりするときに用いると有効です。
ヒストグラム
ヒストグラムは横軸に階級、縦軸に度数にして分布を表したグラフです。
階級はある値からある値までの範囲のことを表しています。
例えば、10代や20代といった年齢層も階級にあたります。
度数は、ある階級に含まれるデータの数のことを指します。
>>>ヒストグラムとは?エクセルでの作成方法と解釈を簡単にわかりやすく
箱ヒゲ図
箱ヒゲ図もヒストグラムと同様に分布を表現するグラフですが、
ヒストグラムよりも平均値や中央値、四分位など、分布の形からでは得られない、
分布についてのより詳細な内容を知ることができます。
具体的な見方については、
>>>箱ひげ図とは?見方やエクセル作り方まで解説!外れ値や平均値も確認できる
をご覧ください。
また、
- バイオリンプロット
- スワームプロット
について別の記事でも紹介しているので、
>>>JMPでグラフの作成方法!ヒストグラムや箱ひげ図以外もグラフビルダーを使って
で紹介しています!
グラフの種類4:データの相関関係を見せたい時は散布図
データの相関関係を見せたいときには、
- 散布図
を使います。
散布図は縦軸と横軸に別の変数を置いて、二つ変数が交わるときに点をプロットしたものです。
相関について詳しくは、
>>>相関係数とは?p値や有意差をどう解釈すれば良いのかわかりやすく!
で解説しています。
グラフの種類と使い分け!まとめ
今回は、
- 値の大小を見せたい
- 全体の中の割合を見せたい
- データのばらつきを見せたい
- データの相関関係を見せたい
ときに用いるグラフについて紹介しました。
ここで紹介した以外にも様々なグラフが存在しますが、
「そのグラフで何を伝えたいか」
がはっきりとしていれば、分かりやすいグラフを選ぶことができます。
コメント