この記事では、SPSSを使ってグラフを作成します。
グラフの中でも、箱ひげ図、ヒストグラム、折れ線グラフ、棒グラフの作成方法について説明します。
データ解析を行う上で、グラフによるデータの観察は欠かせない手段ですね。
収集した視覚的な要約の手段がグラフ(図)であると言えます!
SPSSによるグラフの作成方法
基本的には、SPSSのメニューから[グラフ(G)]→[レガシーダイアログ(L]を選ぶと、さまざまなグラフが描けるようになっていますので非常に簡単です。(下図参照)。
実際にデータを使用してグラフを描いてみましょう!
ここではいくつかのSPSSによるグラフの種類と描き方、注意点についても説明します。
SPSSでヒストグラムを作成する!ヒストグラムとは?
ヒストグラムhistogramは、柱状グラフともよばれ、データを各階殺値に区切って階級ごとの頻度(度数という)をグラフにしたものです。
データの分布が視覚的にわかるのでよく用いられるグラフとなっています。
特に、データが正規分布に従っているかどうかを確認するのに役立ちますね。
ヒストグラムを描くときの面倒な点は、階級数(棒の数のこと)の決定です。
一般的には、スタージェスの公式、
L=[1+log2N] (N=データ数、L=階級效)
を用いて決定します。
この式の[]は、ガウス記号とよばれ、それに含まれる実数値を超えない範囲で最大の整数値を求めるという意味です。
これに対して、探索的データ解析exploratory data analysis (EDA)では、
L=[10 log10N] (N=データ数、L=階級数)
を用います。
しかし、このような知識はとりあえず必要ないとも言えます。
なぜなら、SPSSが勝手に決めてくれるからです。
SPSSでヒストグラムを作る方法
SPSSでヒストグラムを描く手順について説明します。
まず、メニューから下図のように[グラフ(G)]→[レガシーダイアログ(L)]→[ヒストグラム(I)]を選びます。
下図のようなダイアログボックスが現れるので、ヒストグラムを描きたい変数をクリックして移動します。
これでOKをクリックすれば、下図(ヒストグラム)が現れます。
簡単に作成できましたね!
SPSSで箱ひげ図を作る!箱ひげ図とは?
箱ひげ図 box and whisker plotは、データの様相について箱とそこから伸びる“ひげ”で表すユニークな図です。
箱ひげ図は、箱の中央線を中央値、箱の上下辺を四分位範囲として表したグラフです。
ひげは離れた値まで引いています。
さらに高低外れた値は点で表し、該当するデータ行の番号も表示します。
箱ひげ図は、エラーバーグラフと形が似ていますが、データの分布をより詳細に知ることができるので、詳細なデータのばらつきを観察するためには、ぜひとも利用したいグラフです。
また、中央値や四分位範囲を用いるので、正規分布に従わないデータの分布観察には有効です。
SPSSで箱ひげ図の作成方法
箱ひげ図の描き方は、まず下図のようにメニューから[グラフ(G)]→[レガシーダイアログ(L)]→[箱ひげ図(X)]を選びます。
まず、ダイアログボックス下図の[単純]選んで定義をクリックします。
次に、箱ひげ図を出力したい変数をボタンで移動します。
そしてグルーブ分けの変数をボタンで移動します。
最後に、OKをクリックすれば、下図(箱ひげ図)が出力されます。
SPSSで折れ線グラフを作る!折れ線グラフとは?
折れ線グラフは、特に時系列データに対して作成することが多いですね。
横軸が時間を示すデータで、縦軸が平均や中央値などの代表値であることが多いです。
今回は、以下のようなデータを使います。
重要なことは横軸となる「時間を示すデータ」に関しても、1つの変数として保持しておくことです。
SPSSで折れ線グラフを作成!
では早速SPSSで折れ線グラフを作成していきましょう。
まず下図のようにメニューから[グラフ(G)]→[レガシーダイアログ(L)]→[折れ線]を選びます。
すると下記のようなパネルが表示されますので、まずは「単純」を選択して「定義」をクリックします。
今回は縦軸に変化量(Change)の平均値を表示させたいので、縦の表現内容は「その他の統計量(例:平均値)」を選択します。
その上で、Changeを変数に入れます。
すると変数には「MEAN([CHANGE])」と表示されていますので、縦軸にCHANGEの平均値を表示させます、となっていることがわかります。
もし平均値以外の要約統計量を示したい場合には、「統計量の変更」から変更してください。
そして横軸(カテゴリ軸)には、WEEKを入れます。
これでOKです。
すると、以下のように折れ線グラフが作成できました。
SPSSで群ごとの折れ線グラフを作成する方法
先ほどは単純な折れ線グラフを作成しました。
場合によっては「群ごとに折れ線グラフを作成したい」という場合もあるでしょう。
その場合にはSPSSでどのように実施するかをお伝えします。
メニューから[グラフ(G)]→[レガシーダイアログ(L)]→[折れ線]を選ぶのは先ほどと同じですが、その後に「多重」を選択します。
すると下記のようなパネルが表示されますので、縦の表現内容は「その他の統計量(例:平均値)」を選択した上でChangeを変数に入れます。
そして横軸(カテゴリ軸)には、WEEKを入れます。
そして線の定義に「TRTP(群の変数)」を入れます。
すると下記のように、群ごと(AとBごと)に折れ線グラフが表示されました。
SPSSで棒グラフを作る!棒グラフとは?
棒グラフとは、データの数量を長方形の図形で縦に並べて表したグラフのこと。
縦棒グラフは、縦軸に数値、横軸に項目をとって描画したグラフで、一定期間のデータの推移を調べたり、データ間の比較をしたりする時に用いられます。
エラーバーとしてデータのばらつきもセットで示すことも多いですよね。
今回は、以下のようなデータを使います。
こちらに対して、「性別ごとに体重の平均値を棒グラフで示し、標準偏差をエラーバーとして表示させたい」ということを実施していきます。
SPSSで棒グラフを作成!
では早速SPSSで棒グラフを作成していきましょう。
まず下図のようにメニューから[グラフ(G)]→[レガシーダイアログ(L)]→[棒]を選びます。
すると下記のようなパネルが表示されますので、まずは「単純」を選択して「定義」をクリックします。
今回は縦軸に体重の平均値を表示させたいので、縦の表現内容は「その他の統計量(例:平均値)」を選択します。
その上で、体重を変数に入れます。
すると変数には「MEAN([体重])」と表示されていますので、縦軸に体重の平均値を表示させます、となっていることがわかります。
もし平均値以外の要約統計量を示したい場合には、「統計量の変更」から変更してください。
そして横軸(カテゴリ軸)には、性別を入れます。
そして、エラーバーとして標準偏差を示したい、ということでしたので「オプション」をクリックします。
「エラーバーの表示」にチェックを入れ、標準偏差をクリックします。
乗数はとりあえずデフォルトの2でOKです。
乗数とは何かというと、エラーバーの長さのことです。
2に設定しているということは、標準偏差の2倍の長さのエラーバーを表示させてください、ということになります。
この設定で「続行」そして「OK」を押すと、このような棒グラフが完成しました。
SPSSでグラフ作成まとめ
今回はSPSSを使ってヒストグラム・箱ひげ図・折れ線グラフ・棒グラフを作成してみました。
SPSSでは棒グラフ、折れ線グラフ、散布図など様々なグラフを簡単に作成する事が出来ます。
収集したデータに見合ったグラフを作成する事が重要です。
色々なデータを当てはめて視覚的に分かりやすいグラフを作成してみましょう!!
お疲れさまでした。
コメント
コメント一覧 (1件)
[…] つまり、正規性の検定を実施するのではなく、ちゃんと要約統計量やグラフで可視化することによってデータ全体の傾向を判断することが重要。 […]