【毎日Python】Pythonでデータフレームの行列の平均を計算する方法|DataFrame.mean

mean
こつこつPython
import pandas as pd
df = pd.DataFrame({'apple': [150, 120, 210, 190, 220],
                   'banana': [210, 230, 180, 300, 310],
                   'peach': [190, 250, 320, 150, 230],
                   'orange': [110, 200, 140, 230, 290],
                   'cherry': [330, 290, 230, 310, 240]})
df

Pythonで平均の値を取得する方法です。
使用するのはPyhtonのpandasライブラリのmeanメソッドです。
このようなデータフレームを作成します。

df.mean()

まずは引数に何も指定せずに実行してみましょう。
列ごとに平均の値を取得できました。
返り値はfloat型になります。

df.mean(axis=1)

行ごとの平均の値を取得してみましょう。
引数にaxis=1を指定して実行します。
行ごとに平均の値を取得できました。

df = pd.DataFrame({'apple': [150, None, 210, 190, 220],
                   'banana': [210, 230, None, 300, 310],
                   'peach': [190, 250, 320, 150, 230],
                   'orange': [110, None, 140, 230, 290],
                   'cherry': [330, 290, 230, 310, None]})
df
df.mean()

次に、欠損値を含むデータフレームで試してましょう。
このようなデータフレームを使用します。
引数に何も指定せずに実行します。
欠損値を除いた、列ごとの平均の値を取得できました。

df.mean(skipna=False)

欠損値が含まれている時にNanを返したい場合には、引数にskipna=Falseを指定します。
実行します。
欠損値が含まれている列はNanが取得できました。

df.mean(skipna=False, axis=1)

行ごとで取得する場合も同様に実行できます。
欠損値が含まれている行はNanが取得できました。

関連メソッド

【毎日Python】Pythonでデータフレームの行・列の最頻値を取得する方法|DataFrame.mode

【毎日Python】Pythonで配列の平均を算出する方法|numpy.mean,nanmean

未経験からはじめるPython学習「キノクエスト」 キノクエスト
  • スキルアップしたいけど何からはじめればよいかわからない…
  • プログラミングスクールに入りたいけど料金が高い…
  • プログラミングを学んでも業務やキャリアに活かせるか不安…

キノクエストは、このような悩みを持つ方にぴったりのプログラミング学習サービスです。
国内最大級のプログラミング学習系YouTubeチャンネル「キノコード」が提供しているから、未経験者にもわかりやすく質の高い学習体験を実感していただけます。

キノクエスト