Minitab News Letter 2008/01

1. 相関のあれこれ

今回は相関を利用する上でのお話です。


相関係数の結果が出力されたとき、みなさんはどう判断しているでしょうか。例えば、相関係数r=0.6となったとき、強い相関があるのか、それともそうでないのか。これは、比較したい変数や、あるいは自分の経験に照らし合わせて考えた場合などによって、それぞれの立場で全く異なる見解が出てくることでしょう。つまり、単純には判断がつかないということです。

とはいえ、一応、基準というのは世の中にはいくつかありまして、以下はその一つになります。


r = 0 以上、0.3 未満:  相関なし
r = 0.3 以上、0.7 未満:  弱い相関
r = 0.7 以上: 強い相関

これは正の相関における指標ですが、負の相関でも、相関係数にマイナスが付くだけで基準は変わりません。また、あくまでも一つの例にすぎませんので、これが絶対の基準ということはありません。「やや強い」「やや弱い」といった表現を使えば、もう少し細かく分けられるでしょう。

ご存知のように、0に近い相関係数は、必ずしも無関係を意味するものではありません。線形関係がないということだけです。相関係数を求める前に、散布図を利用して必ず図示してください。

相関は、2つの変数が自由に変化することを前提にしています。ある変数の変化を調べるために、一方の変数を固定するような場合には、相関を利用することはできませんのでご注意ください。また、相関関係が強いからといって、それが変数同士の因果関係の強さを表すものではないということを忘れないようにしてください。

なお、統計学者の中には、一方の変数が他方に依存するような状況であるとき、相関を使うべきではないと主張する人もいるそうですが、みなさんはどうお感じになるでしょうか。


[ 2008.1.31 from S.Yukutake ]