2023年末に公開した当社の記事で、生成AIと独自データを組み合わせた「RAG(Retrieval Augmented Generation)」の基本的な仕組みと作り方についてご紹介しました。
生成AIの世界は日進月歩で進化しており、RAGの登場からわずか1年あまりで、さらに高度な技術が次々と実用化されています。
今回は、RAGをより高度に活用することができる「Agent(AIエージェント)」、そして生成AI用USB-Cポートとも言われている「MCP」について解説します。技術の進化と実務での活用の両面から、ビジネスパーソンが押さえておくべきポイントをわかりやすくお伝えします。
目次
RAGの課題
まず、RAGとは何かを簡単に振り返ります。RAGは、ChatGPTのような大規模言語モデル(LLM)が質問応答や文章生成を行う際に、外部の知識ベースから関連情報を検索し、その情報を基に回答を生成する技術です。これにより、もともとLLMが学習していたデータ以外の情報(例えば社内文書など)を活用して正確で信頼性の高い回答を返せるようになります。
RAGは生成AIに社内文書や専門情報を参照させる優れた技術ですが、実務での活用が進む中で以下のような課題が浮かび上がってきました。
- 情報検索と回答の一方通行:RAGは基本的に「質問に対して関連情報を検索し、回答する」という一方通行のプロセスです。会話の文脈を踏まえた複数回のやり取りや、状況に応じた判断には限界があります。
- 単一機能の制約:情報検索と回答生成は得意ですが、データ分析やファイル操作、外部システムとの連携など、複合的なタスクの実行は困難です。
- ユーザーの手間:複数のステップが必要な業務では、各ステップでユーザーが指示を出し続ける必要があり、効率化に限界があります。
これらの課題を解決するために登場したのが「Agent」と呼ばれる新しいアプローチです。
Agentの活用とRAGの進化
Agent(AIエージェント)は、単なる情報検索と回答生成を超えて、ユーザーの意図を理解し、複数のツールやシステムを自律的に操作しながら目的を達成する生成AIの新たな形態です。
もう少し噛み砕いて表現すると、AIエージェントは周囲の状況を理解して、設定された目的に向かって自ら行動することができるAIです。人がゴールを示すと、AI自身がどうすればそれを達成できるかを考え、実行してくれる、アシスタントのようなものだといえます。
RAGとAgentの主な違い
RAG | Agent | |
---|---|---|
動作の特徴 | 受動的(質問に答える) | 能動的(自ら考え行動する) |
使用ツール | 主に検索機能のみ | 複数の外部ツールを利用可能 |
作業の複雑さ | 単一のタスク | 複数ステップの複雑なタスク |
自律性 | 低い | 高い |
ユーザーの関与 | 各ステップで必要 | 目的の指示のみで完結可能 |
Agentの具体的な能力
Agentは高度な能力を持っており以下のようなことが可能です。
- 複数ツールの統合利用:検索、ファイル操作、データ分析、外部API呼び出しなど、多様なツールを状況に応じて使い分けます。
- 推論と計画立案:与えられた目標を達成するために、複数のステップからなる計画を自ら立案し、実行します。
- 文脈理解と継続学習:会話の流れを理解し、過去のやり取りを踏まえて適切に対応します。
- 自律的な判断:途中で問題が発生した場合、ユーザーに確認したり、別のアプローチを試みたりと臨機応変に対応します。
RAGとAgentの相乗効果
前述の通り従来のRAGは単純な「検索→生成」という一方通行の処理に留まっていました。しかし、Agentと連携することで検索プロセス自体が知的かつ柔軟な使い方ができるようになります。具体的には、Agentがユーザーの質問を解釈してRAGに対して繰り返し問い合わせることで以下のような相乗効果が生まれます。
- クエリ最適化の自動化:Agent技術を活用することで、ユーザーの曖昧な質問を理解し、最適な検索クエリ(検索エンジンの検索窓に入力する語句のこと)に変換できます。例えば「去年の営業成績を教えて」という質問に対して、「2024年度 第1〜4四半期 営業部 売上実績」といった具体的な検索クエリを自動生成し、より関連性の高い情報を取得します。
- マルチステップ検索の実現:初回の検索結果を分析し、足りない情報を特定して追加検索を行うといった、複数ステップの検索戦略をAgentが自律的に実行できます。これにより、複雑な質問に対しても包括的な回答が可能になります。
- 文脈を考慮した情報取捨選択:過去の会話履歴や業務コンテキストを考慮して、膨大な検索結果から本当に関連性の高い情報だけを選別できます。これにより、ノイズとなる情報を排除し、精度の高い回答が実現します。
- 情報の検証と信頼性評価:取得した情報の矛盾点や不確実性をAgentが自動検出し、追加の確認や検証を行うことで、回答の信頼性を向上させます。
このようにRAGはAgentと連携することで、より実用的なシステムに進化できます。こうした仕組みはAgentic RAG(エージェント型RAG)という名称でも注目されています。
AWS上でのAgentを使ったアプリ開発
昨今のクラウドサービスでは、Agentを簡単に構築できるサービスも提供されています。例えば、AWSではAmazon Bedrock Agentsを使用することが出来ます。RAGを簡単に構築できるAWSサービスであるAmazon Bedrock Knowledge Basesと組み合わせることで、前述のRAGとAgentを連携した情報探索システムをわずか数時間で構築することも可能です。
MCPが切り開く新たな可能性
Agentの登場により生成AIの活用範囲は大きく広がりましたが、まだ課題はあります。
前述の方法では、AgentはRAGが持っている情報しか活用できません(RAGは社内ドキュメント、Webサイトのコンテンツ、データベースなど、様々な形式のデータソースを参照できますが、参照させたいデータがどこに存在するかを特定して情報を取得できるように作っておく必要があります)。
仕事に使う情報が全てRAGに集約できるのであれば問題ありません。しかし、人が仕事を進めるときは複数の情報源を参照することが多いはずです。例えば、メール、SlackやTeamsなどのチャット、BoxやGoogleドライブのドキュメント、ローカルPC内のファイルなどが該当します。これらの情報を全てAgentやRAGと連携することも不可能ではないですが、多数の情報源との連携方法をすべて一から設計した上でのシステム開発が必要となり莫大なコストと時間がかかります。
そこで、活用できるのがMCPサーバーです。
MCPサーバーとは
MCP(Model Context Protocol)サーバーは、AIモデルと外部データソースやツールを接続するための軽量サーバーです。2024年11月にAnthropicによって発表されたこのオープンプロトコル(仕様が公開されている通信規格)は、AIモデルと様々なシステムを標準化された方法で接続することを可能にします。Anthropicの公式ドキュメントでは、MCPそのものを「AI用のUSB-Cポート」と表現しています。
MCPサーバーの主な特徴
- 標準化されたインターフェース: USB-Cが様々なデバイスを標準化されたインターフェースで接続できるように、MCPサーバーはAgentと様々なデータソースやツールを標準化された方法で接続します。
- 外部リソースへのアクセス: MCPサーバーは特定のデータソースやツールへのアクセスを提供し、Agentが必要に応じてこれらのリソースを利用できるようにします。
- 双方向の通信: AIモデルとデータソースの間で安全な双方向接続を実現し、AIがリアルタイムのコンテキストを取得できるようにします。
- 拡張性: 様々なデータソースやツールに対応するMCPサーバーを追加することで、AIの機能を拡張できます。
- オープン標準: オープンな標準プロトコルであるため、誰でも利用・開発が可能です。
MCPサーバーによるRAGとAgentの連携強化
下図に示すようにMCPサーバーはRAGを含めた様々なデータソースや機能をAgentと接続する橋渡し役になります。
MCPという標準化されたインターフェースでやり取りをすることで、従来のRAGでは連携しきれなかった多くの情報をデータソースとして使用することが可能となります。
MCPサーバーの広がり
MCPは単純な仕様が公開されただけでなく既に活用が始まっています。2025年4月現在、仕様の公開からわずか数ヶ月にもかかわらず、既に以下のように多彩なMCPサーバーが数多く公開されており利用することができます。
- クラウドサービス: AWSやAzure など
- ソースコード管理: GitHubやGitLab など
- ストレージサービス: BoxやGoogle Drive など
- コミュニケーションツール: Slack など
- プロジェクト管理ツール: BacklogやJira など
- ナレッジ検索: Notion など
クライアント側も仕様を発表したAnthropicのClaude Desctopだけでなく、GitHub CopilotやCursorなどの開発ツールでは既に簡単に使う事ができます。旧Twitter(現X)でのOpenAI公式アカウントのつぶやきによるとChatGPTも対応に取り組んでいるとのことですので、近いうちに誰もが使うツールになると思われます。
MCPサーバー導入時のセキュリティ上の注意点
MCPサーバーを活用することで生成AIの可能性は大きく広がりますが、業務情報や個人情報を扱う場合は特にセキュリティに配慮することが重要です。MCPサーバー導入時には以下のようなことを考慮する必要があります。
- データアクセスの制御と認証: MCPサーバーは様々なデータソースへのアクセスを提供するため、適切なアクセス制御メカニズムを実装する必要があります。OAuth 2.0などの標準的な認証プロトコル(ユーザーやデバイスの身元確認を行うための通信ルール)を活用して、ユーザーやシステムごとの権限設定を厳格に管理することが重要です。また、MCPサーバーの接続先となる各システムにおいても、必要最小限の権限のみを付与するプリンシパルを採用すべきです。
- プライバシー保護と情報漏洩防止: MCPサーバーが個人情報や機密情報を扱う場合は、プライバシー保護措置を講じる必要があります。データ最小化の原則に従い、特定の目的に必要な情報のみをAIモデルに提供する仕組みや、センシティブな情報を自動的に検出・マスキングする機能の実装を検討しましょう。
- 脆弱性管理と定期的なセキュリティ評価: MCPサーバー自体やその依存コンポーネントの脆弱性を定期的に確認し、必要なアップデートやパッチを適用することが重要です。また、定期的なセキュリティ評価(実際にネットワークに接続してシステムへの侵入を試みるペネトレーションテストなど)を実施し、潜在的なリスクを特定・対処することをお勧めします。
特に配布されているMCPサーバーを使う場合や、公開されたインターネット上へのアクセスを実施するMCPサーバーを使用する場合は、導入する前に安全性を十分に検証することが重要です。
Agent同士が連携するAgent2Agent (A2A)
今回は詳細な説明はしませんが、複数のAgentが連携するAgent2Agent (A2A)というプロトコルも登場しています。A2Aは2025年4月にGoogleが公開したプロトコルです。前述のMCPがAgentとRAGや各種ツールが連携できるようになるのに対して、A2Aは異なるAIエージェント同士がコミュニケーションし複雑なタスクを解決するアプローチで、生成AIの可能性をさらに広げる技術として期待されています。
先にAIエージェントを「アシスタント」に例えましたが、A2Aによって、まるでチームのように複数のアシスタントが協力してタスクを実行してくれるようになるのです。
実務での活用に向けた課題とアプローチ
このように生成AI技術の進化は目覚ましいものがありますが、実務での活用には多くの課題や検討が必要な項目があります。たとえば、以下のようなものが挙げられます。
- セキュリティとコンプライアンス:機密情報や個人情報の取り扱いに関するリスク管理が重要です。
- 既存業務フローとの整合性:新技術を既存の業務プロセスにどう組み込むかの検討が必要です。
- ユーザー教育と変化管理:新しいツールの効果的な使い方や、業務変革への適応をサポートする取り組みが求められます。
- コスト対効果の評価:導入コストと得られる効果のバランスを適切に見極める必要があります。
このような一般的な課題の他にも、会社や業務の制約により生成AIの製品をスムーズに導入出来ないケースも多々あります。例えば、業務で使用できるクラウドサービスが限られていたり、国外に配置されている生成AIモデルが使用できないケース、会社独自の規制によるネットワーク制限などがあります。
NCDCのアプローチ
私たちNCDCでは、これらの課題に対して、お客様の環境や要件に合わせた段階的なアプローチを提案しています。RAGやエージェントを活用した実証実験(PoC)から始め、効果検証を行いながら徐々に本格導入へとステップアップしていくことで、リスクを最小化しながら効果を最大化する支援を行っています。「生成AIを使って何か業務改善をしたい」という漠然とした悩みから「MCPを業務に導入してみたい」「RAGを作ってみたけど精度がでない」などのやってみたいことや困りごとがありましたら、ぜひ気軽にご相談ください。
まとめ:生成AIと共に進化するビジネスの未来
RAGだけでなくAgentやMCP、さらにはA2Aといった日々進化する生成AI技術は、ビジネスの効率化と創造性の両面で大きな可能性を秘めています。技術の変化スピードは速く、今後も新たな進化が続くと予想されますが、その本質は「人間の知的活動を支援し、拡張する」という点にあります。
変化を恐れず、新しい技術を適切に理解し、自社の課題解決に役立てる視点を持つことが、これからのビジネスパーソンには求められます。NCDCは、そうした挑戦を技術と知見の両面からサポートし、新しいビジネスを切り拓くお手伝いをすることが可能です。