アンケート調査で頻繁に使われる「非常に満足」から「非常に不満」までの5件法。これを統計解析の際に「平均値」を出せる連続データとして扱ってよいのか、迷う実務者は多い。
厳密に言えば、リッカート尺度は順序を付けただけの「順序尺度」である。しかし、適切な条件さえ整えば、これを連続データ(間隔尺度)とみなして解析を進めることは、統計学の現場でも広く認められている。
本記事では、リッカート尺度を連続データとして扱ってよい理由と、そのメリット・デメリット、そして実務上の判断基準について解説する。
なぜ「連続データ」として扱ってよいのか?3つの理由
本来、リッカート尺度はカテゴリーデータに過ぎないが、以下の3つの観点から「連続的な数値」として扱う妥当性が生まれる。
心理的な「等間隔性」の仮定
回答者が選択肢を見た際、無意識に「1と2の差」と「4と5の差」を同じ強さの差として捉えるよう設計されている。この心理的な等間隔性を前提とすることで、数値として計算する道が開ける。
サンプルサイズによる正規分布への接近
統計学には「中心極限定理」という性質がある。サンプルサイズ(回答者数)が十分に大きければ、個々のデータが順序尺度であっても、その平均値の分布は正規分布に近づく。これにより、t検定や分散分析などの高度な解析手法を適用しても、結果が大きく歪みにくいことが研究で示されている。
解析の「解釈性」と実用性
厳密に順序尺度として扱うなら「ノンパラメトリック検定」という手法が必要だが、これは結果の解釈が直感的ではない。平均値や標準偏差を用いた方が、分析結果を第三者に伝える際の説得力と分かりやすさが飛躍的に高まる。
連続データとして扱うメリット・デメリット
リッカート尺度を数値化することは強力な武器になるが、同時にデータの正確性を一部犠牲にする側面もある。
メリット:分析の「解像度」が飛躍的に上がる
- 「差」を明確に示せる(t検定・分散分析):「男性の満足度は3.8、女性は4.2で、統計的に有意な差がある」といった比較が容易になる。
- 「要因」を探ることができる(相関分析・回帰分析):「どのサービスの質が、全体の満足度に最も影響を与えているか?」といった、意思決定に直結する分析が可能になる。
- データの要約がスムーズ:膨大な回答を「平均値」と「標準偏差」に凝縮できるため、報告のスピード感が増す。
デメリット:データの「歪み」を見落とすリスク
- 「平均値」が実態を隠すことがある:例えば、5点満点中で「1点(不満)」と「5点(満足)」が半分ずつだった場合、平均は「3点(普通)」になる。しかし、実際には「普通」と答えた者は一人もいない。平均値だけに頼ると、こうした「二極化」を見落とす危険がある。
- 「間隔」はあくまで推測:「満足(4)」と「非常に満足(5)」の間の心理的距離が、他の選択肢間と同じである保証はない。厳密な数学的根拠を欠いている点は、常に解釈上の限界として残る。
- 外れ値に弱い:少人数の調査では、数人の極端な回答が平均値を大きく左右し、全体の傾向を誤認させる恐れがある。
結局どうすればよいか?実務での判断基準
リッカート尺度を連続データとして扱うなら、以下の「3つのガイドライン」を守るべきである。
- 選択肢は「5つ以上」を確保する: 3件法では間隔が粗すぎて連続体とみなすには無理がある。5件法、できれば7件法を採用することで、統計的な精度が向上する。
- 分布の形を必ず確認する: 平均値を算出する前に、ヒストグラムでデータの分布を確認すること。山なりの分布であれば平均値の信頼性は高いが、二極化している場合は平均値ではなく「中央値」や「比率(%)」で報告するのが適切だ。
- 複数の質問を合算(尺度化)する: 単一の質問項目の平均を見るよりも、同じ目的の質問を複数用意し、その合計点(尺度得点)を分析対象にすることで、より安定した連続データとして扱えるようになる。
まとめ
リッカート尺度は、「5件法以上」かつ「十分なサンプル数」がある場合、実務上は連続データとして扱って問題ない。
平均値を出すことで、データの背景にある傾向を深く探ることが可能になる。ただし、それはあくまで便宜上の数値であることを忘れず、常に「実際の分布はどうなっているか」という視点を持ち続けることが、誠実なデータ分析の第一歩である。
おすすめ書籍
誰も教えてくれなかった 医療統計の使い分け〜迷いやすい解析手法の選び方が,Rで実感しながらわかる!




コメント