協調エージェントチームを構築する¶

ADKでサポートPython v2.0.0Alpha

複雑なタスクの中には、特定の責務を持つ複数のエージェントを必要とし、特に大きく重要なサブタスクをいくつも含む反復的な処理では、より構造化の少ない手順が適している場合があります。ADK の協調エージェントチームでは、コーディネーターエージェントが 1 つ以上のサブエージェントへタスクの委譲を行います。このアプローチにより、特定のタスクを処理するよう定義されたサブエージェントと、タスク完了後に親へ自動的に戻る仕組みを備えた、複雑で自己管理型のエージェントシステムを構築しやすくなります。

この自己管理型エージェントチームのアプローチでは、サブエージェントに動作 mode が割り当てられ、その挙動を管理し作業範囲を制限します。これらの modes はサブエージェント向けの一般的な動作ガイドラインを定め、より予測可能で信頼性の高いマルチエージェントワークフローを作ります。協調モードでは次の設定を利用できます。

Chat: ユーザーとの完全な対話、親エージェントへの手動復帰（既定値、現在の動作）
Task: 明確化のためのユーザー対話を許可し、親エージェントへ自動復帰
Single-turn: ユーザー対話なしで自動復帰し、並列実行が可能

このガイドでは、サブエージェントでモードを使う方法と、これらのモードがエージェントの振る舞いにどう影響するかを説明します。

Alpha リリース

ADK 2.0 は Alpha リリースであり、以前の ADK バージョンと併用する際に互換性を壊す変更が発生する可能性があります。プロダクション環境のように後方互換性が必要な場合は ADK 2.0 を使用しないでください。このリリースをぜひ試していただき、フィードバックをお寄せください。

はじめに¶

次のコード例は、小規模なサブエージェントチームに動作モードを設定し、それらをコーディネーターエージェントへ割り当てる方法を示します。

from google.adk.workflow.agents.llm_agent import Agent

weather_agent = Agent(
    name="weather_checker",
    mode="single_turn",         # no user interaction
    tools=[get_weather, user_info, geocode_address],
)
flight_agent = Agent(
    name="flight_booker",
    mode="task",                # can ask user questions
    input_schema=FlightInput,
    output_schema=FlightResult,
    tools=[search_flights, book_flight],
)
root = Agent(
    name="travel_planner",      # coordinator agent
    sub_agents=[weather_agent, flight_agent],
    # Auto-injects: request_task_weather_checker, request_task_flight_booker
)

このワークフローを実行すると、travel_planner コーディネーターエージェントが自動的にタスクを特定してサブエージェントへ割り当てます。サブエージェントがタスクを完了すると、自動的にコーディネーターエージェントへ戻ります。エージェント、サブエージェント、ワークフローノードで input_schema と output_schema を使ってデータを構造化する詳細については、エージェントワークフローのデータ処理を参照してください。

モード設定と挙動¶

各協調モードには、それぞれ固有の挙動と制限があります。次の表は、各モードで構成されたサブエージェントの属性を比較したものです。

注意: mode はサブエージェント専用

mode 設定は、コーディネーターである親エージェントから呼び出されるサブエージェントで使用することを意図したものです。ルートエージェントに mode 設定を構成しないでください。

Topic \ Mode	`chat` (default)	`task`	`single_turn`
Human in the Loop	完全な対話	明確化のみ	許可されない
ユーザー対話	ユーザーが自由にエージェントと会話	必要に応じてエージェントが質問	ユーザー対話なし
制御フロー	手動ハンドオフまでエージェントが制御	タスク完了までエージェントが制御	タスク直後に即時復帰
並列実行	未サポート	未サポート	複数タスクを並列実行可能
親への復帰	手動 (transfer 経由)	自動 (`complete_task` 経由)	自動 (結果付き)

表 1. ADK の協調エージェント mode の挙動と制限の比較。

運用時の考慮事項¶

協調エージェントモードを使う際は、次のセクションで説明するように、制御の移譲とコンテキスト管理に関するいくつかの考慮事項があります。

ワークフローノードとエージェントの制御移譲¶

task または single-turn モードで構成されたエージェントは、 Workflow Agent のグラフノードとしても、LlmAgent インスタンスと組み合わせても利用できます。ただし、呼び出し元、すなわち親エージェントによって実行時の制御移譲動作は異なります。

ワークフローグラフノードとして使う場合: task エージェントを SequentialAgent や ParallelAgent のようなワークフローグラフ内に配置すると、そのエージェントは自身のタスクを実行します。完了すると、ワークフローエージェントのグラフロジックに従って、制御は自動的に次のノードへ進みます。

LlmAgent から転送される場合: 親の LlmAgent が request_task を通じて task エージェントへ制御を移すと、task エージェントは complete_task を呼び出すまで実行されます。その時点で、制御は転送を開始した元のエージェントへ自動的に戻ります。この挙動は、制御を戻すために明示的な transfer_to_agent 呼び出しを必要とする既定の chat mode エージェントとは異なります。

Invocation Context	After Task Completion
ワークフローノード	グラフ内の次のノードへ進む
LlmAgent からの転送	元のエージェントへ制御を戻す

この違いにより、同じ task エージェントを修正なしで両方のコンテキストで再利用できます。ランタイムは、エージェントがどのように呼び出されたかに応じて適切な制御フローを決定します。

エージェントコンテキストの分離¶

各 task または single-turn モードのエージェントは、自身の分離されたセッションブランチで動作します。これらのエージェントが並列で動作する場合、各エージェントは AI モデル呼び出し用のコンテキストを構築するときに、自分自身のブランチ上のイベントしか参照できず、同僚エージェントが何をしているかは見えません。すべての並列ブランチが完了すると、親エージェントが結果を収集して次の処理へ進めます。

既知の制限事項¶

エージェント協調モードには、いくつかの既知の制限があります。

Task mode agents はリーフエージェントでなければならず、サブエージェントを持てません。