RAGとは?

RAG(Retrieval-Augmented Generation、検索拡張生成) は、LLM(大規模言語モデル)に外部ドキュメントを参照させて回答を生成する技術。ユーザーの質問に対し:

code
質問受信 → 関連ドキュメント検索 → LLMに渡す → 参照回答生成

というフローで動作します。LLMの学習データには含まれない社内マニュアル・最新ドキュメント・機密情報もAIに活用させられます。

RAGの3つのメリット

  1. ハルシネーション削減: 根拠のある回答のみ生成
  2. 最新情報対応: LLMの学習カットオフ以降の情報も反映
  3. 機密データ保護: オンプレRAGで社外流出ゼロ

RAGの基本構成

code
ドキュメント → チャンク分割 → [Embedding](/glossary/embedding) → ベクトルDB
                                                            ↓
ユーザー質問 → Embedding → [Vector Search](/glossary/vector-search)
                                                            ↓
                              関連チャンク取得 → LLMに渡す → 回答

主な実装ツール

企業での活用例

Tufe Companyのクライアント実装:

  1. 社内FAQ自動化: 就業規則RAGで問い合わせ80%削減
  2. 営業提案支援: 過去提案書RAGで新規提案時間を60%短縮
  3. 技術ナレッジAI: 設計書RAGで新人の質問対応を自動化

よくある質問

Q. RAGとファインチューニングどちらが良い?

多くの用途で RAGが優先です。更新が容易で、学習コストも低い。詳細は RAG vs ファインチューニング をご覧ください。

Q. 機密データをAIに渡せる?

クラウドAPIに送る場合は漏洩リスクあり。**オンプレLocal-First AI**での構築を推奨。詳しくはJobDoneBot Enterprise

Q. 精度を上げる方法は?

チャンクサイズ調整・リランキング・ハイブリッド検索(Vector + BM25)が代表的。Tufe Companyは精度最適化支援も提供。

関連用語

Tufe Companyのソリューション