【毎日Python】Pythonでデータフレームの欠損値を確認する方法|isnull

isnull
こつこつPython
import pandas as pd
import numpy as np
df = pd.DataFrame({"Name":["Sato", np.nan, "Tanaka", "Takahashi", "Ito"],
                   "Age": [np.nan, 24, np.nan, 35, 28],
                   "Smoke": [False, True, True, np.nan, False]})
df

Pythonでデータフレームの欠損値を確認する方法です。
使用するのは、pandas.DataFrameのisnullメソッドです。
このようなデータフレームを作成します。

df.isnull()

欠損値の場合は、Trueが表示されます。
実行します。
データフレーム全体がbool型で返ってきました。

df.isnull().sum()

isnullメソッドにsum関数を追加すると、欠損値の数をカラムごとに表示することができます。
実行します。
データ全体で、どのくらいの欠損値があるのかを把握するにに便利です。

df['Age'].mask(df['Age'].isnull(), df['Age'].mean())

また、maskメソッドと組み合わせると、欠損値を平均値で埋めることができます。

df['Age'].fillna(df['Age'].mean())

ちなみにこれと同じようなことはfillnaメソッドでも可能です。

関連メソッド

【毎日Python】Pythonでデータフレームの条件に応じて値を変更する方法|mask

【毎日Python】Pythonでデータフレームの欠損値を置換する方法|fillna

未経験からはじめるPython学習「キノクエスト」 キノクエスト
  • スキルアップしたいけど何からはじめればよいかわからない…
  • プログラミングスクールに入りたいけど料金が高い…
  • プログラミングを学んでも業務やキャリアに活かせるか不安…

キノクエストは、このような悩みを持つ方にぴったりのプログラミング学習サービスです。
国内最大級のプログラミング学習系YouTubeチャンネル「キノコード」が提供しているから、未経験者にもわかりやすく質の高い学習体験を実感していただけます。

キノクエスト