import pandas as pd
df = pd.DataFrame({'apple': [150, 120, 210, 190, 220],
'banana': [210, 230, 180, 300, 310],
'peach': [190, 250, 320, 150, 230],
'orange': [110, 200, 140, 230, 290],
'cherry': [330, 290, 230, 310, 240]})
df
Pythonで平均の値を取得する方法です。
使用するのはPyhtonのpandasライブラリのmeanメソッドです。
このようなデータフレームを作成します。
df.mean()
まずは引数に何も指定せずに実行してみましょう。
列ごとに平均の値を取得できました。
返り値はfloat型になります。
df.mean(axis=1)
行ごとの平均の値を取得してみましょう。
引数にaxis=1を指定して実行します。
行ごとに平均の値を取得できました。
df = pd.DataFrame({'apple': [150, None, 210, 190, 220],
'banana': [210, 230, None, 300, 310],
'peach': [190, 250, 320, 150, 230],
'orange': [110, None, 140, 230, 290],
'cherry': [330, 290, 230, 310, None]})
df
df.mean()
次に、欠損値を含むデータフレームで試してましょう。
このようなデータフレームを使用します。
引数に何も指定せずに実行します。
欠損値を除いた、列ごとの平均の値を取得できました。
df.mean(skipna=False)
欠損値が含まれている時にNanを返したい場合には、引数にskipna=Falseを指定します。
実行します。
欠損値が含まれている列はNanが取得できました。
df.mean(skipna=False, axis=1)
行ごとで取得する場合も同様に実行できます。
欠損値が含まれている行はNanが取得できました。