【キノカレッジ|機械学習実践クラス|22年12月】心臓病の予測をしよう

課題内容

あなたは、データサイエンティストとして病院に従事しています。
心血管疾患は世界的な死因の第1位であり、毎年推定1790万人の命を奪い、世界の全死亡者の31%を占めています。
今回、病院で集めた患者のデータから心不全の恐れのある患者をいち早く察知し、死亡リスクを下げたいという旨の依頼がありました。
機械学習モデルができると早期発見と管理の大きな助けとなります。
11のカラムのデータをもとに、心臓病であるかどうかの2値分類予測をしてください。

データセット

※保存方法
Mac:右クリック⇒「リンク先を別名で保存」
Windows:右クリック⇒「名前を付けてリンク先を保存」

データセットのカラム説明

名前カラムの意味
HeartDisease出力クラス [1: 心臓病, 0: 正常]
Age患者の年齢
Sex患者の性別 (M: 男性 F: 女性)
ChestPainType胸痛の種類 [TA: 典型的狭心症, ATA: 非典型狭心症, NAP: 非狭心症性疼痛、ASY:無症状]
RestingBP安静時血圧
Cholesterol血清コレステロール[mg/dl]値
FastingBS空腹時血糖値 [1: FastingBS > 120 mg/dl, 0: それ以外の場合]
RestingECG安静時心電図結果[Normal: ST:ST-T波異常(T波反転及び/又は0.05mV以上のST上昇又はST低下)を有する、LVH:エステスの基準による左室肥大の可能性又は確定を示す]
ExerciseAngina運動誘発性狭心症【Y:Yes, N:No】
Oldpeak安静時と比較した運動時のST低下
ST_Slope運動時STピークセグメントの傾き [Up: 上り勾配、Flat: 平坦、Down: 下り勾配]
MaxHR最高心拍数 [60~202の数値]

評価方法

・評価方法は、「AUC」を使用してください。
・評価値は0~1の間をとり、精度が高いほど大きな値となります。

【参考】
PythonのAUC実装方法(sklearn公式ページ)
https://scikit-learn.org/stable/modules/generated/sklearn.metrics.roc_auc_score.html

提出フォーム

∞∞∞∞∞∞∞∞∞∞∞
※キノカレッジのユーザー様のみ閲覧できます。
※キノクエストにログインをしてご利用ください。
∞∞∞∞∞∞∞∞∞∞∞
提出フォームはこちら