【毎日Python】Pythonでデータフレームの行列の平均を計算する方法|DataFrame.mean

【毎日Python】Pythonでデータフレームの行列の平均を計算する方法|DataFrame.mean
import pandas as pd
df = pd.DataFrame({'apple': [150, 120, 210, 190, 220],
                   'banana': [210, 230, 180, 300, 310],
                   'peach': [190, 250, 320, 150, 230],
                   'orange': [110, 200, 140, 230, 290],
                   'cherry': [330, 290, 230, 310, 240]})
df

Pythonで平均の値を取得する方法です。
使用するのはPyhtonのpandasライブラリのmeanメソッドです。
このようなデータフレームを作成します。

df.mean()

まずは引数に何も指定せずに実行してみましょう。
列ごとに平均の値を取得できました。
返り値はfloat型になります。

df.mean(axis=1)

行ごとの平均の値を取得してみましょう。
引数にaxis=1を指定して実行します。
行ごとに平均の値を取得できました。

df = pd.DataFrame({'apple': [150, None, 210, 190, 220],
                   'banana': [210, 230, None, 300, 310],
                   'peach': [190, 250, 320, 150, 230],
                   'orange': [110, None, 140, 230, 290],
                   'cherry': [330, 290, 230, 310, None]})
df
df.mean()

次に、欠損値を含むデータフレームで試してましょう。
このようなデータフレームを使用します。
引数に何も指定せずに実行します。
欠損値を除いた、列ごとの平均の値を取得できました。

df.mean(skipna=False)

欠損値が含まれている時にNanを返したい場合には、引数にskipna=Falseを指定します。
実行します。
欠損値が含まれている列はNanが取得できました。

df.mean(skipna=False, axis=1)

行ごとで取得する場合も同様に実行できます。
欠損値が含まれている行はNanが取得できました。

関連メソッド

【毎日Python】Pythonでデータフレームの行・列の最頻値を取得する方法|DataFrame.mode