【こつこつPython】Pythonで相関係数を取得する方法|numpy.corrcoef

【こつこつPython】Pythonで相関係数を取得する方法|numpy.corrcoef

Pythonで相関係数を取得する方法です。
使用するのはPythonのnumpyライブラリのcorrcoef関数です。
相関係数は1に近いと正の相関があり、-1に近いと負の相関があり、0に近いと相関があまりないことを意味します。

import numpy as np

1行目に身長のデータ、2行目に体重のデータが入った2次元配列を使用します。

a = np.array([[150, 160, 170, 180, 190], 
              [55, 60, 65, 60, 70]])
a

まず、corrcoef関数を使用して、身長と体重の相関係数を取得してみましょう。
引数に相関係数を求めたい配列を指定します。
実行します。

np.corrcoef(a)

身長と体重の相関係数を取得できました。
なお、結果は行列で返され、対角成分は同じデータの相関係数なので基本的に1が入ります。

また、引数に要素数が同じ配列のデータを追加できます。
腹囲のデータが入った配列を追加してみます。
実行します。

b = np.array([60, 85, 55, 60, 70])
np.corrcoef(a, b)

3つのデータの相関係数を取得できました。
1行2列成分には身長と体重の相関係数が入り、1行3列成分には身長と腹囲の相関係数が入り、2行3列成分には体重と腹囲の相関係数が入ります。

関連メソッド

【こつこつPython】Pythonで分散共分散行列を取得する方法|numpy.cov

【こつこつPython】Pythonで配列の平均、分散、標準偏差を取得する方法|numpy.sum/var/std