【毎日Python】Pythonのデータフレームで特定の文字列を含むかどうか確認する方法|str.contains

import pandas as pd
df = pd.read_csv('data.csv',encoding='shift-jis')
df

Pythonで、特定の文字を含むかどうかを確認する方法です。
使用するのはPandasシリーズのstr.containsメソッドです。

CSVファイルをインポートします。
このようなデータフレームです。

df['都道府県名'].str.contains('山')

都道府県名のカラムに、「山」という文字が含まれるか確認してみましょう。
引数に、検索したい文字列を指定します。
実行します。
TrueかFalseが返ってきました。

df[df['都道府県名'].str.contains('山')]

都道府県に「山」を含むデータを抽出してみましょう。

山形、富山、山口などが抽出できました。

df[df['都道府県名'].str.startswith('山')]
df[df['都道府県名'].str.endswith('山')]

似たメソッドに、str.startswith、str.endswithがあります。
それぞれ、特定位の文字列ではじまる、特定の文字列で終わるデータを確認できます。

関連メソッド

【毎日Python】Pythonでデータフレームの条件に応じて値を変更する方法|mask,where

【毎日Python】Pythonのデータフレームで特定の値の要素を抽出する方法|isin