import pandas as pd
df = pd.read_csv('data.csv')
df.head()
データフレームで、特定の値を含むデータを抽出する方法です。
使用するのは、PythonのPandasデータフレームのisinメソッドです。
CSVデータを読み込みます。このようなデータフレームです。
df['year'].isin([2015])
商品分類がトップスのデータを抽出してみましょう。
商品分類のカラムにisinメソッド、引数に検索したい値をリストで指定します。
実行します。
TrueかFalseのブール型で返ってきました。
df[df['商品分類'].isin(['トップス', 'アウター'])]
リストを複数にすることで、抽出条件を追加することができます。
商品分類を、トップスとアウターで抽出してみましょう。
2010と2015のデータを抽出できました。
df[df['商品名'].isin(['シャツ']) & df['社員ID'].isin(['a003'])]
複数の条件で抽出したい場合は、このように条件を&やORでつなぎます。
商品名がシャツで、社員IDがa003のデータを抽出してみましょう。
抽出できました。
関連メソッド
【毎日Python】Pythonでデータフレームの欠損値を確認する方法|isnull