top of page
Search

ChatGPT・Claude・Geminiのディープリサーチ機能を徹底解説:内部で動く複数AIの仕組みを可視化する

  • Writer: 峻 福地
    峻 福地
  • Jun 9
  • 6 min read
ChatGPT・Claude・Geminiのディープリサーチ機能を徹底解説:内部で動く複数AIの仕組みを可視化する

はじめに:大手AIのディープリサーチ機能に隠された秘密

ChatGPT、Gemini、Claudeに搭載されているDeep Research機能は、単に情報を検索するだけでなく、ユーザーの曖昧な指示から意図を汲み取り、自律的に多角的な調査を行い、最終的に深い洞察を含んだ包括的なレポートを生成するAIシステムです。


私もこれらのディープリサーチにはかなり仕事上お世話になっていますし、皆様もかなり活用されているかと思います。


ディープリサーチエージェントの驚くべき能力は、単一の高性能なAIによって実現されているわけではありません。その核となるのは、それぞれが専門的な役割を持つ複数のAIエージェントが、まるで人間の専門家チームのように連携して動作する「マルチAIエージェントシステム」です。


この「分業」こそが、調査の質とスピードを飛躍的に向上させる鍵となります。


本記事では、ノーコードAIエージェントビルダーAgensを使って、視覚的にディープリサーチエージェントを実装しつつ、AIエージェントとは?マルチAIエージェントシステムとは何かをわかりやすく解説していきます。


ディープリサーチ機能の内部構造を可視化する

ディープリサーチとは、表面的な情報収集を超えて、複数の情報源から関連情報を収集し、それらを分析・統合して包括的な洞察を得るプロセスです。大手AIサービスのディープリサーチ機能は、一般的に以下のような構造になっています。これを可視化したのが、下記の図です:

ChatGPT・Claude・Geminiのディープリサーチ機能を徹底解説:内部で動く複数AIの仕組みを可視化する

この図は、実際にAIエージェントプラットフォーム「Agens」で再現したディープリサーチシステムの構成ですが、ChatGPTやClaudeの内部構造も概ねこのような形になっていると推測されます。以下の5つのエージェントが連携して動作します:


  1. リサーチパイプライン(全体管理)

  2. クエリ分析エージェント(検索キーワード生成)

  3. 並列検索エージェント(複数の検索を同時実行)

  4. 統合・分析エージェント(情報の統合と分析)

  5. 最終プレゼンター(結果の提示)



AIエージェントの3つの核となる構成要素

AIエージェントの基本アーキテクチャは、オーケストレーター、モデル(実行エージェント)、ツールの3つの主要コンポーネントから構成されています。これらが連携することで、単なる言語モデルを超えた能力を実現しています。

AIエージェントの3つの核となる構成要素

AIエージェントの基本アーキテクチャは、オーケストレーター、モデル(実行エージェント)、ツールの3つの主要コンポーネントから構成されています。これらが連携することで、単なる言語モデルを超えた能力を実現しています。


オーケストレーション層:思考と行動のフレームワーク

オーケストレーション層は、エージェントが情報を取り込み、内部で推論し、その推論に基づいて次のアクションを決定する循環プロセスを管理します。


役割

  • 調査プロセス全体を順次実行

  • 各エージェントへのタスク割り当て

  • 結果の受け渡しを管理

オーケストレーション層:思考と行動のフレームワーク

オーケストレーション層は、エージェントが情報を取り込み、内部で推論し、その推論に基づいて次のアクションを決定する循環プロセスを管理します。


モデル(実行エージェント):実行の中心

モデルはエージェントの「脳」とも言える部分で、中央の意思決定・実行ユニットとして機能します。ディープリサーチエージェントのプロセスにおける実際のタスク、クエリの分析や調査、レポートの生成を担います。

モデル(実行エージェント):実行の中心

モデルはエージェントの「脳」とも言える部分で、中央の意思決定・実行ユニットとして機能します。ディープリサーチエージェントのプロセスにおける実際のタスク、クエリの分析や調査、レポートの生成を担います。


ツール:外部世界との接点

言語モデルは文章処理に優れていますが、実世界を直接認識・操作することはできません。ツールはこのギャップを埋め、エージェントが外部システムやデータと相互作用できるようにします。これによりディープリサーチのウェブ検索を可能にします。

ツール:外部世界との接点

言語モデルは文章処理に優れていますが、実世界を直接認識・操作することはできません。ツールはこのギャップを埋め、エージェントが外部システムやデータと相互作用できるようにします。これによりディープリサーチのウェブ検索を可能にします。



各コンポーネントの役割を詳しく見る


1. オーケストレーター:全体の指揮者

1. オーケストレーター:全体の指揮者

図の最上部にある「リサーチパイプライン」が、システム全体の指揮者(オーケストレーター)です。


役割

  • 調査プロセス全体を順次実行

  • 各エージェントへのタスク割り当て

  • 結果の受け渡しを管理

図の最上部にある「リサーチパイプライン」が、システム全体の指揮者(オーケストレーター)です。



役割:





調査プロセス全体を順次実行



各エージェントへのタスク割り当て



結果の受け渡しを管理

例えばChatGPTで「検索中...」と表示される時、実はこのオーケストレーターが各エージェントに指示を出し実行を行っている最中なのです。図では「Root」というラベルが付いており、これがシステムのエントリーポイントであることを示しています。



2. クエリ分析エージェント:質問を検索可能な形に変換

ユーザーの質問を受け取った最初のステップが「クエリ分析」です。

実際の処理例

ユーザー入力:「最新のAI規制について教えて」
↓
クエリ分析エージェントの出力:
- "AI regulation 2024"
- "artificial intelligence policy update"
- "AI規制 最新動向 日本"

ユーザーの曖昧な質問を具体的な検索キーワードに変換し、生成した検索クエリをsearch_queryとして次のプロセスに渡しています。


3. 並列検索システム:複数の情報源から同時に収集

ここがディープリサーチの核心部分です。図の「並列検索エージェント」は、検索ツールを2つのエージェントを同時に実行しています:

3. 並列検索システム:複数の情報源から同時に収集

ここがディープリサーチの核心部分です。図の「並列検索エージェント」は、検索ツールを2つのエージェントを同時に実行しています:

  • 包括検索エージェント:Multi Searchツールを使用

  • DD詳細取得エージェント:Tavily Searchツールを使用


なぜ並列実行が重要か

  1. 速度:直列処理よりも高速で完了

  2. 多様性:異なる検索エンジンから異なる視点の情報を取得

  3. 信頼性:1つの検索が失敗しても他でカバー


複数の検索APIが並列で動作し、Webページ、ニュース、学術論文など、様々な情報源から情報を収集しています。


4. 情報統合・分析エージェント:バラバラの情報を意味のある知識に

統合・分析エージェント」は、並列検索で得られた情報を統合します。

4. 情報統合・分析エージェント:バラバラの情報を意味のある知識に

「統合・分析エージェント」は、並列検索で得られた情報を統合します。

処理内容

  • 重複情報の除去

  • 矛盾する情報の識別

  • 信頼性の評価

  • 重要ポイントの抽出


例えば、同じニュースが複数のソースから取得された場合、重複を除去し、最も信頼できる情報源を優先します。



5. 最終プレゼンター:人間が理解しやすい形に整形

最後の「最終プレゼンター」は、分析結果をユーザーに提示する役割を担います。

5. 最終プレゼンター:人間が理解しやすい形に整形

最後の「最終プレゼンター」は、分析結果をユーザーに提示する役割を担います。

出力形式例

ディープリサーチレポートの出力例


なぜこのような構造が必要なのか

単一AIモデルの根本的な制限

通常の単一のLLMモデルには以下の制限があります:


  1. 知識の固定:訓練時点での情報しか持たない

  2. リアルタイム性の欠如:最新情報にアクセスできない

  3. 検証能力の限界:情報の真偽を外部ソースで確認できない


マルチエージェントアプローチの利点

マルチAIエージェントシステムにすることで:

  • 専門性:各エージェントが特定のタスクに特化

  • 並列性:複数の処理を同時実行で高速化

  • 信頼性:複数の情報源から検証

  • 拡張性:新しい検索ツールや分析手法を簡単に追加


まとめ:なぜこの仕組みが革新的なのか

ディープリサーチ機能は、単なる「検索機能付きAI」ではありません。それは:


  1. 専門化されたAIの協調:各ステップに特化したAIが連携

  2. 並列処理による高速化:複数の検索を同時実行

  3. 多段階の品質保証:分析、統合、整形の各段階でチェック

  4. 透明性のある処理:各ステップで何が行われているか明確


この仕組みを理解することで、これらのツールをより効果的に活用できるだけでなく、自社のニーズに合わせたカスタムシステムの設計も可能になります。


図で示したような構造は、Agensのようなノーコードツールを使えば、誰でも構築可能です。重要なのは、どのような情報をどのように処理するかという設計思想を理解することです。


本記事の可視化図は、実際にAgensで構築したシステムです。このような複雑な処理フローも、視覚的に理解し、カスタマイズできる時代になりました。あなたも、自社専用のディープリサーチシステムを構築してみませんか?

 
 
 

Comments


bottom of page