【毎日Python】Pythonのデータフレームで特定の値の要素を抽出する方法|isin

【毎日Python】Pythonのデータフレームで特定の値の要素を抽出する方法|isin
import pandas as pd

df = pd.read_csv('data.csv')

df.head()

データフレームで、特定の値を含むデータを抽出する方法です。
使用するのは、PythonのPandasデータフレームのisinメソッドです。
CSVデータを読み込みます。このようなデータフレームです。

df['year'].isin([2015])

商品分類がトップスのデータを抽出してみましょう。
商品分類のカラムにisinメソッド、引数に検索したい値をリストで指定します。
実行します。
TrueかFalseのブール型で返ってきました。

df[df['商品分類'].isin(['トップス', 'アウター'])]

リストを複数にすることで、抽出条件を追加することができます。
商品分類を、トップスとアウターで抽出してみましょう。

2010と2015のデータを抽出できました。

df[df['商品名'].isin(['シャツ']) & df['社員ID'].isin(['a003'])]

複数の条件で抽出したい場合は、このように条件を&やORでつなぎます。
商品名がシャツで、社員IDがa003のデータを抽出してみましょう。
抽出できました。

関連メソッド

【毎日Python】Pythonでデータフレームの欠損値を確認する方法|isnull

【毎日Python】Pythonで行名と列名を指定して値を取得する方法|DataFrame.loc

【毎日Python】Pythonでデータフレームから条件を指定してデータを抽出する方法|DataFrame.query