医療統計を学ぶ過程で必ず遭遇するのが「相関係数」だ。
しかし、多くの初心者が、最も著名な「ピアソンの積率相関係数」を安易に選択してしまう傾向にある。
実は、臨床研究で扱うデータには特有の「クセ」があり、ピアソンが苦手とする状況が頻発する。
本稿では、実務上の判断基準として、いつスピアマン(順位相関)に切り替えるべきかを、数式を排して明快に解説する。
そもそも「順位相関」とは何を見ているのか
一言で言えば、数値をそのまま扱うのではなく、「大きい順に並べ替えた番号(順位)」同士の相関を評価する手法である。
- ピアソン: 身長160cmと170cmといった「数値の差」そのものを評価対象とする。
- スピアマン: 「Aさんが1位、Bさんが2位……」という「順番」のみで評価を下す 。
一見すると情報を捨てているように思えるが、医療データにおいては、この「あえて細部を捨てる」姿勢が、解析結果の堅牢性(ロバスト性)を担保することに繋がるのである。
スピアマンを迷わず選ぶべき3つのケース
① アンケートやステージなどの「段階データ」
医療現場には、数値化されていても、その間隔が均等ではないデータが散見される。
- がんのステージ(I、II、III、IV)
- 痛みの指標(VAS:0〜10)
- ADLの評価スコア
例えば、ステージIとIIの差が、ステージIIIとIVの差と医学的に等価であるとは限らない。こうした「順序尺度」を解析する場合、連続量として扱うピアソンよりも、順位に基づくスピアマンの方が圧倒的に適している。
② 「外れ値(特異な症例)」が含まれる時
臨床において、1人だけ極端な検査値(例:CRPの異常高値)を示す症例に遭遇することは珍しくない。
ピアソンはこうした「外れ値」に極めて弱く、極端な1例によって相関係数が大きく歪められるリスクがある 。 対してスピアマンは、いかに数値が突出していようとも、順位に変換すれば単なる「1位」として処理される。つまり、外れ値の影響を最小限に抑え、解析結果を安定させることが可能だ。
③ 関係性が「一直線」ではない時
薬理作用のように、投与量を増やすと効果も向上するが、ある一点から飽和(横ばい)するようなケースが該当する。
- ピアソン: 「直線的な比例関係」しか評価の対象とならない。
- スピアマン: 直線でなくとも、「Xが増えれば、とにかくYも増える(単調増加)」という傾向さえあれば、正当に高い評価を下すことができる。
データが描く曲線の中に潜む「右肩上がり」という本質を捉えるには、スピアマンの方が有用である。
迷った時の「統計的プロセス」
どちらの手法を採用すべきか判断に窮した際は、以下の手順を推奨する。
- 散布図の作成: まずは視覚的に、関係が直線的か、あるいは外れ値が存在しないかを確認する。
- 両手法の併用: ピアソンとスピアマンの両方を算出してみる。もし両者の結果に大きな乖離があるならば、それはデータに「強い偏り」や「潜在的な外れ値」が隠れている重要なサインである。
- 安全策としての選択: 医療データのように正規分布(きれいな山形)が期待しにくいドメインでは、スピアマンを選択することが、より安全で誠実な解析への第一歩となる。
まとめ:使い分けのクイックチェック
| データの状況 | 推奨される手法 |
| 正規分布する数値データ(身長、体重など) | ピアソン |
| ステージや段階評価(VAS、リッカート尺度など) | スピアマン |
| 外れ値の影響を排除し、ロバストに解析したい | スピアマン |
| 関係が直線ではなく「カーブ」を描いている | スピアマン |
単に「p値が有意かどうか」に固執する段階を脱し、データの性質を理解して適切な手法を選択すること。それが、研究および臨床におけるエビデンスの信頼性を高める唯一の道である。




コメント