【毎日Python】Pandasのデータフレームの欠損値の行を削除する方法|dropna

dropna
こつこつPython
import pandas as pd
import numpy as np
df = pd.DataFrame(
    [[1,np.nan,3], [np.nan,'abc',6], [np.nan, np.nan,np.nan],[10,11,12]],
    columns=['col01', 'col02', 'col03'],
    index=['idx01', 'idx02', 'idx03','idx04'])
df
df.dropna()

データフレームの欠損値を削除する方法です。
使用するメソッドは、pandasデータフレームのdropnaメソッドです。
このような欠損値を含むデータフレームを作成します。
引数を指定せずに実行すると、欠損値がある行が削除されます。
実行します。

1つでも欠損値がある行を削除することができました。

df.dropna(subset=['col01'])

特定のカラムが欠損値の行を削除する場合は、引数subsetにカラムを指定します。
実行します。

削除できています。

dropna(how='all')

全ての値が欠損値の行を削除したい場合は、引数howにallを渡します。
実行します。
idx03の行が削除されました。

df.dropna(inplace=True)
df

元のデータフレームにも反映させるには、引数inplaceにTrueを渡します。

関連メソッド

【毎日Python】Pandasのデータフレームの行や列を削除する方法|drop

【毎日Python】Pandasのデータフレームの重複する行を削除する方法|drop_duplicates

未経験からはじめるPython学習「キノクエスト」 キノクエスト
  • スキルアップしたいけど何からはじめればよいかわからない…
  • プログラミングスクールに入りたいけど料金が高い…
  • プログラミングを学んでも業務やキャリアに活かせるか不安…

キノクエストは、このような悩みを持つ方にぴったりのプログラミング学習サービスです。
国内最大級のプログラミング学習系YouTubeチャンネル「キノコード」が提供しているから、未経験者にもわかりやすく質の高い学習体験を実感していただけます。

キノクエスト