【キノカレッジ|機械学習実践クラス|22年11月】売上個数予測

課題内容

あなたは、ソフトウェア販売会社のデータアナリストです。
仕入れ部門の部長から「在庫に欠品があると売上毀損してしまう。在庫が0になる前に、仕入れをしたいと思っている。そこで、商品(item_id)ごとに、来月の売上個数を予測をしてほしい」というオーダーがありました。
そこで、33ヶ月分(カラム:date_block_numの0〜32)のデータをもとに、34ヶ月目(カラム:date_block_numの33)の各商品の売上個数を予測してください。
なお、店舗(shop_id)ごとの商品の売上個数ではなく、店舗関係なく34ヶ月目の各商品の売上個数を予測してください

データセット

訓練用データはこちら

提出用データはこちら

※保存方法
ファイルをGoogleDriveにアップしています。
下記画像のボタンからダウンロードをお願いします。
なお、訓練用データは537MBあるため、環境によってはダウンロードにお時間がかかります。

GoogleDriveからのダウンロード方法

データセットのカラム説明

カラム名説明
shop_id店ごとに振り分けられた番号
item_id商品ごとに振り分けられた番号
item_category_idカテゴリーごとに振られた番号
item_cnt_day各店舗における各商品の1日あたりの売上個数
item_price商品の値段
date年/月/日
date_block_num連続した月の番号 (2013/01を0として一ヶ月ごとに1加える)
item_name商品名
shop_name店名
item_category_nameカテゴリー名

評価方法

・item_idごとに来月の売上個数を予測してください。

・評価方法は「RMSE」を使用してください。

・値が小さいほど精度が高く(=誤差が少なく)なります。

【参考】
PythonのRMSE実装方法(sklearn公式ページ)
https://scikit-learn.org/stable/modules/generated/sklearn.metrics.mean_squared_error.html

提出フォーム

∞∞∞∞∞∞∞∞∞∞∞
※キノカレッジのユーザー様のみ閲覧できます。
※キノクエストにログインをしてご利用ください。
∞∞∞∞∞∞∞∞∞∞∞

提出フォームはこちら