機械学習とは、コンピューターにある問題についての学習をさせて、問題に潜むパターンを見つけだす技術のことをいいます。
どういう意味でしょうか?
ECサイトで使われている機械学習を例にみてみましょう。
ECサイトには、ユーザーの商品の購入データがあります。
その何万、何億という大量の購入データをコンピューターに学習させます。
学習の結果「Aという商品を購入するユーザーはBという商品を購入する」というパターンを見つけ出します。
パターンを見つけ出せば、A商品を購入したユーザーにはB商品をオススメすることができます。
この学習してパターンを見つけ出す技術が、機械学習です。
機械学習は、英語のMachine Learningと呼ばれることがあります。
人工知能、ディープラーニングとの関係
人工知能という言葉は、機械学習を指すこともあります。
しかし、人工知能は、人間のような知能をコンピューターに持たせる技術のことです。
そのため、人工知能を実現するひとつの技術として機械学習があるという関係です。
また、ディープラーニングという言葉もありますが、ディープラーニングは機械学習の手法の1つです。
機械学習の活用事例
機械学習はさまざまな分野で活用されています。
マーケティングの分野では、先ほどの例の商品のレコメンド(おすすめ)に使われていたり、売上や需要の予測に使われています。
自動車の分野では、自動運転のプログラムに活用されています。2020年代には、自動運転は実用化されると言われています。
医療の分野では、CTスキャンの画像を学習させて、病気の診断に使われています。例えば、がん診断では、放射線科医より高い性能を出す機械学習が出始めてきています。
金融の分野では、株や為替の取引をロボットトレーダーが担当しています。ゴールドマンサックスでは2000年には600人いた株式トレーダーが2人までに激減しました。
セキュリティの分野では、顔認証の技術で機械学習が使われています。
機械学習の学習手法
機械学習の学習手法には、いつくか種類があります。
代表的なものが、教師あり学習、教師なし学習、強化学習です。
教師あり学習とは、学習するデータに正解があるデータの学習手法です。
正解データとは、機械学習の結果として予測や分類をしたい「答え」のようなものです。
例えば、トレードで価格を予想したいのであれば、学習するデータに価格があれば正解データがあることになります。
また、ユーザーが購入するユーザーか購入しないユーザーか分類したいのであれば、学習するデータに購入の有無があれば正解データがあることになります。
正解データがある学習手法が教師あり学習です。
教師なし学習とは、正解データがない学習手法です。
例えば、ユーザーを分類したり、特徴を減らすのに使われます。
最後に、強化学習です。
教師あり学習も教師なし学習も過去のデータをもとに学習をしますが、強化学習はデータがない状態で学習をします。
例えるならお掃除ロボットです。
お掃除ロボットが初めて家にきた場合、壁や物にぶつかりながら学習していきます。過去データがなくても、データをとりながら学習していきます。これが強化学習です。
機械学習ができるプログラミング言語
機械学習ができるプログラミング言語として有名なのがPythonです。
プログラミング言語で人気上位に位置しているPython。
詳しくはPythonの解説動画があるので、そちらをご覧ください。