分析の概要
ビジネスシーンでよくある顧客分析が今回のテーマです。
お配りするデータは、とある銀行のキャンペーンの結果(定期預金の口座開設の有無)です。
このデータを元に、定期預金の口座開設の有無を予測して頂きます。
上司の依頼は「キャンペーンコストが限られているので、すべての顧客のキャンペーンを案内できない。
口座開設する可能性が高い顧客のアタックリストを作って欲しい」というものです。
あなたの会社でも顧客データや購入データがあるかもしれません。
明日から使える分析テーマとして取り上げました。
データセット
・「提出用データはこちら」には、yがありません。このyを予測して提出をしていただきます。なお、下記にもありますが、定額預金申し込みありは「1」、なしは「0」です。
・検証用データがありませんので、訓練用データを訓練用と検証用のわけて交差検証をお願いします。
・提出する際は、IDをDataframeのindexにして、カラムをyのみにして提出をお願いします。
※保存方法
Mac:右クリック⇒「リンク先を別名で保存」
Windows:右クリック⇒「名前を付けてリンク先を保存」
データセットのカラム説明
カラム名 | 説明 |
---|---|
ID | インデックスとして使用 |
age | 年齢 |
job | 職種 |
marital | 未婚/既婚 |
education | 教育水準 |
default | クレジットの支払い遅延の有無(yes, no) |
balance | 年間平均残高(€) |
housing | 住宅ローンの有無(yes, no) |
loan | 個人ローンの有無(yes, no) |
contact | 連絡方法 |
day | 最終接触日 |
month | 最終接触月 |
duration | 最終接触時間(秒) |
campaign | 現キャンペーンにおける接触回数 |
pdays | 前キャンペーン接触後からの経過日数 |
previous | 現キャンペーン以前までに顧客に接触した回数 |
poutcome | 前回のキャンペーンの成果 |
y | 定額預金申し込み有無(1:あり, 0:なし) |
評価方法
・評価方法は、「AUC」を使用してください。
・評価値は0~1の間をとり、精度が高いほど大きな値となります。
【参考】
PythonのAUC実装方法(sklearn公式ページ)
https://scikit-learn.org/stable/modules/generated/sklearn.metrics.roc_auc_score.html