Search

検索したいワードを入力してください

相関係数ってなに?公式から求める方法や使いどころなどをご紹介

更新日:2022年05月09日

相関係数とはなにか、どのような場面で活用するべきか分からないという方もいるでしょう。本記事では、相関係数の求め方や評価方法、使いどころ、注意すべきポイントなどを紹介します。本記事を参考にして、相関係数を上手に活用し、ビジネスに活かしましょう。

相関係数ってなに?

相関係数とは、2種類のデータの関連性、相関関係の強さを数値で表したものです。この相関係数によって、関連性の強さや特徴が分かります。

この記事で解説する相関係数は、一次関数の式(y=ax+b)の直線的な関係の強さを表す指標です。そのため、相関係数を導くことで、どれだけ直線関係に近いかが分かるでしょう。

相関係数で求められる3つの相関

2つのデータの関連性の特徴は、相関係数の大きさによって3種類に分けられます。相関係数によって導かれる「正の相関」「負の相関」「相関がない」のそれぞれについて解説します。

相関がない

まず、相関係数が「0に近い」場合、2つのデータ間には「ほとんど相関がない」と言えます。

これは、2種のデータ間に直線的な関連性がないことを意味しています。散布図を見るとデータのポイントがばらついて点在しており、散布図が円形になります。この場合、「1つの変数はもう一方の変数に影響を与えない」と言えるでしょう。

たとえば、「身長」と「年収」の関係性などは、「ほとんど相関がない」の例です。

正の相関

一方、相関係数が「1.0に近い」場合、2つのデータ間には「正の相関がある」と言えます。

2種のデータ間に直線的な関連性があり、散布図を見ると右上がりになっています。この場合、「1つの変数が増加すると、もう一方の変数も増加する傾向がある」ことを意味しています。

たとえば、「身長」と「体重」の関係性などは「正の相関」にあたるでしょう。

負の相関

逆に、相関係数が「-1.0に近い」場合、2つのデータ間には「負の相関がある」と言えます。

正の相関と同様、2種のデータ間に直線的な関連性がありますが、散布図を見ると右下がりになっています。この場合、「1つの変数が増加すると、もう一方の変数も減少する傾向がある」ことを意味しています。

たとえば、「勉強時間」と「赤点の回数」の関係性などは「負の相関」にあたるでしょう。

相関係数を評価する時に用いられる基準

前述したとおり、相関係数が1.0に近いと2つのデータ間には正の相関が、-1.0に近いと負の相関があり、0に近いと相関がないと判断されます。

また、厳密な基準はないものの、相関係数についての評価は、以下のように分けられるのが一般的です。

・0.7以上1.0以下:強い正の相関
・0.5以上0.7未満:正の相関
・0.2以上0.5未満:弱い正の相関
・-0.2以上0.2未満:相関がない
・-0.5以上-0.2未満:弱い負の相関
・-0.7以上-0.5未満:負の相関
・-1.0以上-0.7未満:強い負の相関

相関係数の絶対値が概ね0.5を超えると、相関のパターンが判別できるようになるでしょう。

相関係数を求めるための公式

2つの変数xとyの間の相関係数rは、以下の公式で求めることができます。

r=1/nΣ(xi-xn)(yi-yn)/√1/nΣ(xi-xn)^2×√1/nΣ(yi-yn)^2

nは「データ(x,y)の個数」、xi・yiは「x,yそれぞれの数値」、xnは「xの平均」、ynは「y」の平均です。

次のページ:相関係数を導く方法

初回公開日:2022年05月09日

記載されている内容は2022年05月09日時点のものです。現在の情報と異なる可能性がありますので、ご了承ください。
また、記事に記載されている情報は自己責任でご活用いただき、本記事の内容に関する事項については、専門家等に相談するようにしてください。

Latests