import pandas as pd
import numpy as np
df = pd.DataFrame(
[[1,np.nan,3], [np.nan,'abc',6], [np.nan, np.nan,np.nan],[10,11,12]],
columns=['col01', 'col02', 'col03'],
index=['idx01', 'idx02', 'idx03','idx04'])
df
df.dropna()
データフレームの欠損値を削除する方法です。
使用するメソッドは、pandasデータフレームのdropnaメソッドです。
このような欠損値を含むデータフレームを作成します。
引数を指定せずに実行すると、欠損値がある行が削除されます。
実行します。
1つでも欠損値がある行を削除することができました。
df.dropna(subset=['col01'])
特定のカラムが欠損値の行を削除する場合は、引数subsetにカラムを指定します。
実行します。
削除できています。
dropna(how='all')
全ての値が欠損値の行を削除したい場合は、引数howにallを渡します。
実行します。
idx03の行が削除されました。
df.dropna(inplace=True)
df
元のデータフレームにも反映させるには、引数inplaceにTrueを渡します。