はじめに
こんにちは。
キノコードです。
生成AIをカスタマイズできるのを知っていますか?
できるんです。
RAGという技術を使えばできます。
この動画は、RAGについて次のような疑問を解消します。
- RAGとは何?
- RAGのメリットは?
- RAGの仕組みはどうなっているのか?
最新技術の「RAG」について、具体例を交えて解説をしてきます。
この動画を見ると、RAGについて人に説明ができるようになり、色々なアイディアが思いつくでしょう。
最後までご覧ください。
ITやDXについての学びを発信する「キノコード」です。
私は紀貫之の子孫ですが、文章ではなくコードを書いているので「キノコード」と名乗っています。
ぜひ、チャンネル登録をお願いします。
RAGとは
RAGとは、「Retrieval-Augmented Generation」の略です。
Retrievalは、「情報検索」という意味です。
Augmentedは、「拡張された」という意味です。
Generationは、「生成」という意味です。
つまり、RAGとは、Retrieval、外部の情報を検索して取り入れ、Generation、それによってAIの生成能力を、Augmented、拡張する仕組みです。
なぜRAGが必要なのか?
それでは、なぜRAGが必要なのでしょうか?
LLMの動画でも説明をしましたが、生成AIには「最新の情報に追いつけない場合がある」「特定の分野や自社独自の内容には答えられない」という弱点があります。
つまり、LLMは一度学習が終わると、その時点以降に出てきた新しい情報を知ることができません。
また、LLMは広範囲の知識を持っていますが、専門的な分野や企業固有の情報に関しては、正確な回答が難しい場合があります。
さらには、LLMの課題として最新情報、企業独自の情報を知っているLLMを開発するには、「コストが高い」という弱点があります。
GPT-4の開発には、サーバー費用、電気代などを含めて、100億円以上かかったと言われています。
そこで考えられたのがRAGです。
RAGの仕組み
RAGとは、外部の情報を検索して取り入れ、それによってAIの生成能力を拡張する仕組みとお伝えしました。
RAGについて言葉を使って説明をするより、図を使って説明をするとわかりやすいです。
RAGがどのように動作するかを図を使って、ステップごとに説明をしていきますね。
-
ユーザーが質問をする
ユーザーは、チャットツールやアプリを通じて、調べたい内容を入力します。
例えば、「会社のルールについて教えて」と質問を送ります。 -
アプリが検索する
ユーザーの質問に応じて、アプリがデータベースやファイルから関連データを検索します。
ここでいうファイルとは、社内文書や議事録などのテキストファイルをイメージしてください。
また、データベースとは、社内文書や議事録が格納されているデータベースのイメージです。
アプリは、データベースやファイルから関連性の高い情報を抽出をします。 -
LLMが回答を生成する
ユーザーが送った質問と、データベースなどから抽出された関連性の高い情報をセットにして生成AIに指示を出します。
例えば、企業独自の就業規則の内容をもとに、「会社のルールについて教えて」と指示が出されます。
ユーザーが送った質問と、関連性の高い情報を使ってLLMが回答を生成します。
このプロセスでは、生成AI(LLM)が、抽出された情報を活用して正確な回答を作ります。
- ユーザーが回答を受け取る
生成された回答が、ユーザーに返されます。
回答には、回答に使用したデータベースの情報元の提示することができるため、信頼性が高まります。
例えば、「この答えは会社の就業規則の10条に基づいています」と明示されます。
このように、RAGは、AIが回答を作る前に、自社のデータベースなどの学習していない「外部にある知識」を検索して取り込みます。
その情報を使うことで、学習をやり直さなくても最新の情報を回答に反映できます。
つまり、RAGを使えば「外部から最新の情報」を簡単に取り込めるという特徴があり多くの企業で導入が進んでいます。
RAGを使うメリット
LLMの弱点は、「最新の情報に追いつけない場合がある」「特定の分野や企業固有の内容には答えられない」「コストが高い」。
LLMの課題として挙げられるこれらの弱点を解決できるRAG。
ここでは、RAGを使うことで得られる3つの大きなメリットについて詳しく解説します。
1つめ。コストを抑えて追加情報を反映できる
2つめ。知識を手軽に更新できる
3つめ。生成AIの嘘を減らせる
順に解説していきます。
コストを抑えて追加情報を反映できる
LLMが最新情報、企業独自の情報を答えられるようにするために、LLMをいちから開発するため、莫大な費用がかかります。
しかし、RAGを導入すれば、LLMをいちから開発することなく、最新情報、企業独自の情報を取り込めます。
その結果、生成結果の精度を高めながら、コストを抑えることができます。
知識を手軽に更新できる
LLMは、一度学習が終わると、その後に登場した新しい情報を知りません。
しかし、RAGを使えば、外部データベースを更新するだけで済みます。
モデルを作り直さなくても、企業独自の情報を反映しやすくなります。
生成AIの嘘を減らせる
LLMは、誤った回答をあたかも正しいように作ってしまうことがあります。
これを「ハルシネーション(幻覚)」と呼びます。
RAGなら、検索で得た信頼性の高い情報に基づいて回答を生成します。
そのため、でたらめな回答のリスクが下がり、正確性が向上します。
以上のように、RAGはLLMの弱点を補うことができます。
このような背景があり、RAGは、多くの企業や組織で導入が進んでおり、今後ますます重要性が高まる技術と想定されます。
まとめ
この動画で学んだことをまとめます。
- RAG(Retrieval Augmented Generation)は、外部の情報を取り込んで生成AIの能力を拡張する技術です
- RAGを使うと、コストを抑えて最新の情報をAIに反映できます
- RAGは、知識を手軽に更新でき、生成AIの誤回答を減らせます
- RAGの仕組みは、ユーザーの質問に対して関連データを検索し、生成AIが回答を生成するプロセスです
明日から、RAGの知識を活かして、生成AIを自分の仕事にもっと役立ててみましょう!
DX人材育成サービスも個人の学習もキノクエスト
個人のお客様向けのキノクエストでは、プロンプトエンジニアリングの授業、RAGを使った生成AIカスタマイズの授業、企業独自のLLMを構築する授業、ノーコードで生成AIアプリを作成できるDifyの授業などがあります。
基礎的な内容だと、プログラミングの基礎やExcelの授業、ITパスポートの授業、高度なものだとデータサイエンス、アプリ開発の授業もあります。
動画ごとに確認問題やキノクエスト限定の認定試験で、知識の定着を強力にサポートします。ログイン後にすぐに実践できる環境で、効率的な学習が可能です。
法人のお客様には、企業向けサービス「キノクエストforBiz」で、DX推進に必要な人材育成をサポートします。
YouTubeで培った多彩なコンテンツを基に、社員の方のスキルアップを促進します。
キノコードの動画を著作権や利用規約を気にすることなく安心して社内教育にご利用いただけます。
今ならリスキリング助成金の申請・確定通知を受けられれば、キノクエストforBizの料金の60~75%が国から助成されます。
弊社の提携社労士事務所が申請などを全面的にサポート。
高い費用対効果と助成金の活用で、企業の成長を後押しします。
初回相談は無料です。下記フォームから、お気軽にご相談ください。
https://kino-code.com/contact-form/