【毎日Python】Pandasのデータフレームの欠損値の行を削除する方法|dropna

【毎日Python】Pandasのデータフレームの欠損値の行を削除する方法|dropna
import pandas as pd
import numpy as np
df = pd.DataFrame(
    [[1,np.nan,3], [np.nan,'abc',6], [np.nan, np.nan,np.nan],[10,11,12]],
    columns=['col01', 'col02', 'col03'],
    index=['idx01', 'idx02', 'idx03','idx04'])
df
df.dropna()

データフレームの欠損値を削除する方法です。
使用するメソッドは、pandasデータフレームのdropnaメソッドです。
このような欠損値を含むデータフレームを作成します。
引数を指定せずに実行すると、欠損値がある行が削除されます。
実行します。

1つでも欠損値がある行を削除することができました。

df.dropna(subset=['col01'])

特定のカラムが欠損値の行を削除する場合は、引数subsetにカラムを指定します。
実行します。

削除できています。

dropna(how='all')

全ての値が欠損値の行を削除したい場合は、引数howにallを渡します。
実行します。
idx03の行が削除されました。

df.dropna(inplace=True)
df

元のデータフレームにも反映させるには、引数inplaceにTrueを渡します。

関連メソッド

【毎日Python】Pandasのデータフレームの行や列を削除する方法|drop

【毎日Python】Pandasのデータフレームの重複する行を削除する方法|drop_duplicates