NVIDIA、ロボットに“高速ペン回し”も教えるGPT-4搭載AI「Eureka」|itmediaからのニュース

https://www.itmedia.co.jp/news/articles/2310/21/news052.html
マイクロソフト、生成AIの国内導入は560社以上と報告--パートナー新施策も予告|ZDNet(ジーディーネット)からのニュース

強化学習と生成AIを使って、ロボットに“ペン回し”を覚えさせる取り組みです。
2足歩行のロボットの制御にも使われています。
強化学習は、例えば、歩いてみて何か良いことがあれば「ご褒美」をもらい、何か悪いことがあれば「お仕置き」を受けることになります。
目的地までうまく歩くことができれば「ご褒美」です。
うまく歩くことができなかった「お仕置き」です。
この「ご褒美」と「お仕置き」を繰り返しながら、左右バランスやスピードなどどうやって歩くのがベストかを学びます。

最近だと、プログラミングは生成AIとともにあります。
アイディアや設計を人間が考えて、ChatGPTのコードを書いてもらうのが一般的になっています。
この取り組みも同様ですね。

強化学習は、2足歩行などのロボット工学、マーケティングでは推薦システム、自動車業界には自動運転にも活用されています。