ADK 向け Cartesia MCP ツール¶

Supported in ADKPythonTypeScript

Cartesia MCP Server は ADK エージェントを Cartesia の AI オーディオプラットフォームへ接続します。この連携により、エージェントは自然言語で音声生成、言語間の音声ローカライズ、オーディオコンテンツ作成を行えます。

ユースケース¶

テキスト読み上げ (TTS) 生成: Cartesia の多様な音声ライブラリを使ってテキストを自然な音声に変換し、音声選択や出力形式を細かく制御します。
音声ローカライズ: 既存の音声を別言語へ変換しつつ、元話者の特徴を保持します。多言語コンテンツ制作に最適です。
オーディオインフィル: オーディオセグメント間の空白を埋めて滑らかな遷移を作成します。ポッドキャスト編集やオーディオブック制作に有用です。
音声変換: オーディオクリップを Cartesia ライブラリ内の別の声に変換します。

前提条件¶

Cartesia アカウントの作成
Cartesia playground で API キーを生成

エージェントで使う¶

PythonTypeScript

Local MCP Server

from google.adk.agents import Agent
from google.adk.tools.mcp_tool import McpToolset
from google.adk.tools.mcp_tool.mcp_session_manager import StdioConnectionParams
from mcp import StdioServerParameters

CARTESIA_API_KEY = "YOUR_CARTESIA_API_KEY"

root_agent = Agent(
    model="gemini-2.5-pro",
    name="cartesia_agent",
    instruction="Help users generate speech and work with audio content",
    tools=[
        McpToolset(
            connection_params=StdioConnectionParams(
                server_params=StdioServerParameters(
                    command="uvx",
                    args=["cartesia-mcp"],
                    env={
                        "CARTESIA_API_KEY": CARTESIA_API_KEY,
                        # "OUTPUT_DIRECTORY": "/path/to/output",  # Optional
                    }
                ),
                timeout=30,
            ),
        )
    ],
)

Local MCP Server

import { LlmAgent, MCPToolset } from "@google/adk";

const CARTESIA_API_KEY = "YOUR_CARTESIA_API_KEY";

const rootAgent = new LlmAgent({
    model: "gemini-2.5-pro",
    name: "cartesia_agent",
    instruction: "Help users generate speech and work with audio content",
    tools: [
        new MCPToolset({
            type: "StdioConnectionParams",
            serverParams: {
                command: "uvx",
                args: ["cartesia-mcp"],
                env: {
                    CARTESIA_API_KEY: CARTESIA_API_KEY,
                    // OUTPUT_DIRECTORY: "/path/to/output",  // Optional
                },
            },
        }),
    ],
});

export { rootAgent };

利用可能なツール¶

Tool	Description
`text_to_speech`	指定した音声でテキストを音声へ変換
`list_voices`	利用可能な Cartesia 音声一覧を取得
`get_voice`	特定音声の詳細取得
`clone_voice`	音声サンプルから音声クローン作成
`update_voice`	既存音声を更新
`delete_voice`	ライブラリから音声を削除
`localize_voice`	音声を別言語へ変換
`voice_change`	音声ファイルを別音声へ変換
`infill`	音声セグメント間の空白を補完

設定¶

Cartesia MCP サーバーは環境変数で設定できます:

Variable	Description	Required
`CARTESIA_API_KEY`	Cartesia API キー	Yes
`OUTPUT_DIRECTORY`	生成オーディオを保存するディレクトリ	No

ADK 向け Cartesia MCP ツール¶

ユースケース¶

前提条件¶

エージェントで使う¶

利用可能なツール¶

設定¶

追加リソース¶