import pandas as pd
df=pd.read_csv('/content/sample_data/california_housing_test.csv')
df.head()
df.corr()
Pythonで各カラム間の相関係数を確認する方法です。
使用するのは、Pythonのpandasライブラリのcorrメソッドです。
相関係数とは2つのデータ間の関係を-1から1までの数値で表したものです。
1に近いほど「正の相関」があるといい、一方のデータの値が増加すると他方のデータの値も増加します。
逆に、-1に近いほど「負の相関」があるといい、一方のデータの値が増加すると他方のデータの値は減少します。
また、0に近いほど2つのデータ間には「相関がない」ということになります。
実行します。
相関係数を表示することができました。
corrメソッドは数値型とブール型が計算対象になります。
なお、欠損値は計算対象から外されます。