2024年12月5日、ChatGPTを開発・提供しているOpenAIがChagGPTの新しいモデルを発表しました。
発表内容は大きく分けて2つです。
1つめは、今までの最上位モデルがo1-previewのみでしたが、o1のフルバージョンが使えるようになったこと。
2つめは、ChatGTP Proという新しいプランができたことです。
この動画では次のようなことが解消できます。
・ChatGPT-o1は何が変わったの?
・o1の新機能とは?
・o1を使うと何ができるの?
この動画では、これらについてわかりやすく解説をしていきますね。
IT、DX、AIについての学びを発信する「キノコード」です。
私は紀貫之の子孫で、文章ではなくコードを書いているので「キノコード」と名乗っています。
ぜひ、チャンネル登録をお願いします。
ChatGPT-o1の3つの特徴
ChatGPT-o1の特徴は3つです。
1つめ。ChatGPTがさらに賢くなった。
2つめ。スピードアップした。
3つめ。目と耳を手に入れた
1つずつ解説していきます。
賢くなった
賢くなったについて説明します。
openaiの公式サイトのから3つのグラフを紹介します。
1つめのグラフです。
o1に、全米の高校生が受ける難しい数学の試験AIMEの問題を解かせました。
4oの正解率が13%、o1-previewは56%です。
o1は、脅威の86%でした。
これは、上位5%に入る実力です。
この試験を受けるのは、とても優秀な学生たちです。
日本で言えば、灘高校や開成高校などの生徒が受験して上位5%です。
2つめグラフです。
o1に、プログラミングの技術や問題解決能力を測る競技プログラミングのCodeforcesの結果です。
縦軸は、パーセンタイルです。
パーセンタイルとは、たとえば、100人が受けるテストがあったとします。80パーセンタイルっていうのは、上から数えて20番目、または下から数えて80番目の位置を意味します。
4oは11パーセンタイル、o1-previewは62パーセンタイルです。
o1は、89パーセンタイルです。
つまり、100人いたとしたら、上位は11人しかいないという意味になります。
コードを書くレベルとしてもトップエンジニアレベルです。
3つめのグラフです。
GPQAというAIの賢さをテストするための試験があります。
具体的には、生物、化学、物理の難しい問題が問われる試験です。
4oの正解率が56%、o1-previewは78.3%。
o1は、o1-previewとほぼ同じ正解率です。
人間の博士レベルの精度を超えています。
このように、o1は、人間の博士レベルを超える賢さをもっているということになります。
なぜ賢くなったのか?
では、なぜo1は、賢くなったのでしょうか?
技術的な面も話しつつ、わかりやすく説明をしていきますね。
4oでは、人間からの質問や指示に対して「それっぽい答え」を出していました。
生成AIは、膨大な文章を学習させています。
そのパターンを覚えています。
AといえばB。
BといえばC。
と言ったパターンを覚えています。
つまり、人間からの質問や指示に対して、学習しているパターンに基づいて答えを返していただけで、自分で考えるわけではありませんでした。
しかし、o1では、自分で考える力を手に入れました。
それがo1が大幅に賢くなった理由です。
具体的には、Chain of Thought「思考の連鎖」と、Self-Consistency「自己整合性」という技術を取り入れたからです。
これらは、プロンプトエンジニアリングのテクニックとして、論文で精度があがることとして証明されているものです。
これらを、o1では標準で取り入れたのです。
なお、私のチャンネル「キノコード」でプロンプトエンジニアリング超入門という授業をやっているので、詳細はこちらで解説をします。
ぜひご覧になってください。
では、Chain of Thought「思考の連鎖」、Self-Consistency「自己整合性」はどんなテクニックなのでしょうか?
詳細はプロンプトエンジニアリング超入門に譲るとして、ここでは簡単に説明をします。
通常のプロンプトでは、先ほどもお伝えしたように、質問や指示に対して「それっぽい答え」を出しているだけです。
しかし、Chain of Thought「思考の連鎖」は、問題をいくつかの小さなステップに分けて、それぞれ順番に考える方法です。たとえば、「目的地に行くのに電車を使うとして、どれくらい時間がかかるか?」という質問の場合、「ステップ1:家から駅まで歩く時間を考える(10分)」ステップ2:電車で移動する時間を計算(20分)」「ステップ3:駅から目的地まで歩く時間を足す(10分)」「結論:合計で40分かかる」と導き出すと言うイメージです。
Self-Consistency「自己整合性」は、1つの質問に対していくつかの方法で考えてみて、出てきた答えを比べる方法です。その中で、一番多く出てきた答えや、一貫性のある答えを選びます。これによって、間違った答えが選ばれる可能性を減らすことができます。
o1が賢くなった要因は、他にもありますが、Chain of Thought「思考の連鎖」とSelf-Consistency「自己整合性」を技術的基盤にしたことにより、生成AIが自分で考える力を持ち、賢くなったのです。
自分で考えられるようになったなんて、もはや人間みたいですよね!
もっと賢くなる
openaiは、ChatGPTは、もっと賢くなるぞといっています。
左のグラフは、AIがたくさんのコンピューターを使って色々なパターンを学習すればするほど、正しい答えを出せることを表しているグラフです。
また、右のグラフは、AIが考える時間を増やせば増やすほど、正しい答えを出せることを表しているグラフです。これは、問題をじっくり考えればミスが減ることと同じです。
ここから言えることは、新しいモデル「o1」がすでに非常に高い能力を示しているものの、まだ発展途上であるということです。
今後、さらなる性能向上が可能だということを示唆しています。
つまり、「o1はすでに優秀だが、これからもっと賢くなるからもう少し待っていてほしい」というメッセージが含まれていると言えます。
(イメージでOK)
人間の知能のように幅広いタスクを処理できるAIのことをAGIといいます。
AGIは、複雑な問題を解決したり、クリエイティブなタスクをこなしたり、新しい情報をもとにスキルを自分で習得できます。
ソフトバンクの孫正義さんは、AGIは10年後、つまり2034年に実現できるといっています。
OpenAIのサムアルトマンさんは、AGIは2030-2031年ごろには実現できるといっています。
社会が大きく変わっている転換点にきていると私は考えています。
速くなった
2つめのポイント、速くなったについてです。
o1-previewは、4oより賢いけど、回答の生成までに時間がかかる。つまり、遅かったです。。。。
でも、新しく出たo1は、簡単な質問にはすぐに答え、複雑な質問には適切な時間をかけるようになりました。
つまり、質問内容の難易度に応じた応答速度が最適化されています。
また、o1は、処理速度が50%向上しました。
つまり、30秒かかっていた処理が、50%早くなると約20秒になります。
つまり、30秒 ÷ 1.5 ≒ 20秒です。
私がo1を触ってみた体感だと、50%以上の速度向上を感じられます。
目と耳を手に入れた
3つめのポイント、目と耳を手に入れたです。
o1-previewでは、画像をアップすることができませんでした。
しかし、o1では画像をアップロードできるようになりました。
たとえば、「この画像に写ってるのは何?」とか「この表を読み取って説明して」ということができます。
また、財務諸表のPDFをポンと渡して、企業分析をするということもできます。
他にも、o1-previewでは音声での対応がありませんでした。
o1では、音声での対応も可能です。
o1からは、テキストだけじゃなくて画像や音声もAIが理解してくれるんです。
つまり、目と耳を手に入れました。
テキストだけでなく、画像や音声といった異なる種類のデータ、つまりマルチモーダルに対応したということです。
o1-pro
最後に、o1-proについてです。
ChatGPTのプランは、無料プラン、Plusプランの2つだけでした。
しかし、このたび、3つ目のプランとして、ChatGPT Proプランがリリースされました。
値段は、月額200ドル。
1ドル150円で換算をすると、月額30,000円。
Plusプランに比べて、10倍の値段です。
Proプランでは、Plusでできることがすべてできることに加えて、
・o1への無制限アクセス
・高度な音声(Advanced Voice Mode)への無制限アクセス
・o1よりさらに賢いo1-proを利用することができます
しかし、私を含めた庶民にはなかなか手の届きにくい価格ですよね。
私もまだ使っていません。
どんな人におすすめか。
o1には使用制限があります。
o1やAdvanced Voice Modeをガンガン使いたい人であれば、元は取れる可能性があるでしょう。
まとめ
この動画で学んだことをまとめます。
・ChatGPT-o1は、より賢くなり、優秀な人間のように考えることができるようになった
・応答速度が速くなり、質問に素早く答えるようになった
・画像や音声も理解できるようになり、マルチモーダルに対応した
・月額200ドルのo1-proというo1より賢く、使い放題のプランができた。
DX人材育成サービスも個人の学習もキノクエスト
個人のお客様向けのキノクエストでは、生成AIの活用事例の講座、無料で簡単に生成AIアプリを作れるDifyの講座が学べます。
また、Pythonを使ったRAGやファインチューニングや、企業オリジナルなLLMを構築できる学習コンテンツもあります。
動画の確認問題やキノクエスト限定の認定試験で、知識の定着もバッチリです。ログイン後すぐに生成AIを使える環境で、あなたの学習をサポートします。
法人のお客様には、キノクエストforBizがおすすめです。
YouTubeで培った多様なコンテンツを基に、DXを加速させる企業人材を育成するeラーニングサービス「キノクエストforBiz」を提供。
キノコードの動画を著作権や利用規約を気にすることなく安心して学習することができます。
今ならリスキリング助成金の申請・確定通知を受けられれば、キノクエストの料金の60~75%が国から助成されます。
弊社の提携社労士事務所が申請などをまるっとサポート。
高い費用対効果と助成金の活用で、DX人材育成をサポートします。
初回相談は無料です。下記フォームから、お気軽にご相談ください。
https://kino-code.com/contact-form/