コンテンツにスキップ

Bright Data

Bright Data MCPサーバーは、ADKエージェントをBright DataのWebデータプラットフォームに接続します。このツールは、エージェントにリアルタイムのWeb検索、Webページのスクレイピング、構造化データの抽出、ブラウザのリモート制御、人気のあるプラットフォームからの事前構築済みデータフィードへのアクセス機能を提供します。

ユースケース

  • リアルタイムWeb検索: 最適化されたWeb検索を実行して、AIに適した形式(JSON/Markdown)で最新情報を取得します。

  • 構造化データ抽出: AIを活用した抽出を使用して、オプションのカスタムプロンプトを使用して、あらゆるWebページをクリーンで構造化されたJSONデータに変換します。

  • ブラウザの自動化: 複雑なインタラクション、JavaScriptのレンダリング、動的なコンテンツ抽出のために、実際のブラウザをリモートで制御します。

  • 事前構築済みデータAPI: Amazon、LinkedIn、Instagram、TikTok、Googleマップなど、人気のあるプラットフォームから60以上の構造化データセットにアクセスします。

  • 広告分析: 業界標準の広告ブロックフィルターリストを使用して、Webページから広告を抽出して分析します。

前提条件

  • APIトークンを取得するには、Bright Dataアカウントにサインアップしてください。
  • 詳細については、ドキュメントを参照してください。
  • サーバーは、プロトタイピングや日常のワークフローに役立つ月間5,000リクエストの無料利用枠を提供しています。

エージェントでの使用

from google.adk.agents import Agent
from google.adk.tools.mcp_tool.mcp_session_manager import StdioConnectionParams
from google.adk.tools.mcp_tool import McpToolset
from mcp import StdioServerParameters

BRIGHTDATA_API_TOKEN = "YOUR_BRIGHTDATA_API_TOKEN"

root_agent = Agent(
    model="gemini-1.5-pro",
    name="brightdata_agent",
    instruction="Bright Dataを使用してユーザーがWebデータにアクセスできるように支援します",
    tools=[
        McpToolset(
            connection_params=StdioConnectionParams(
                server_params = StdioServerParameters(
                    command="npx",
                    args=[
                        "@brightdata/mcp",
                    ],
                    env={
                        "API_TOKEN": BRIGHTDATA_API_TOKEN,
                        "PRO_MODE": "true",  # オプション: 60以上のすべてのツールを有効にする
                    }
                ),
                timeout=300,
            ),
        )
    ],
)
from google.adk.agents import Agent
from google.adk.tools.mcp_tool.mcp_session_manager import StreamableHTTPServerParams
from google.adk.tools.mcp_tool import McpToolset

BRIGHTDATA_API_TOKEN = "YOUR_BRIGHTDATA_API_TOKEN"

root_agent = Agent(
    model="gemini-1.5-pro",
    name="brightdata_agent",
    instruction="""Bright Dataを使用してユーザーがWebデータにアクセスできるように支援します""",
    tools=[
        McpToolset(
            connection_params=StreamableHTTPServerParams(
                url=f"https://mcp.brightdata.com/mcp?token={BRIGHTDATA_API_TOKEN}",
            ),
        )
    ],
)

使用例

エージェントをセットアップして実行すると、コマンドラインインターフェイスまたはWebインターフェイスを介してエージェントと対話できます。以下にいくつかの例を示します。

サンプルエージェントプロンプト:

AmazonでiPhone 15 Proの現在の価格と詳細を教えてください

Googleで「2025年の気候変動ニュース」を検索し、上位5件の結果を要約してください

techcrunch.comのホームページをスクレイピングし、すべての記事の見出しとリンクを抽出してください

エージェントは適切なBright Dataツールを自動的に呼び出して包括的な回答を提供するため、手動でナビゲートしたり、ブロックされることを心配したりすることなく、リアルタイムのWebデータに簡単にアクセスできます。

利用可能なツール

Bright Data MCPサーバーは、2つのモードで動作します。

ラピッドモード(無料利用枠 - デフォルト)

ツール 説明
search_engine Google、Bing、またはYandexのSERPをJSONまたはMarkdownとしてスクレイピングします。
scrape_as_markdown 組み込みのブロック解除機能を使用して、WebページをクリーンなMarkdownに変換します。
scrape_as_html ブロッカーをバイパスしながら、Webページから生のHTMLを返します。
extract カスタムプロンプトを使用して、Markdown出力を構造化JSONに変換します。
session_stats セッションの使用状況の統計とツール呼び出し数を表示します。

プロモード(60以上の追加ツール)

環境変数でPRO_MODE=trueを設定してプロモードを有効にすると、以下にアクセスできます。

一括操作: - search_engine_batch: 最大10件の検索クエリを同時に実行します。 - scrape_batch: 最大10個のURLを同時にスクレイピングします。

ブラウザの自動化: - scraping_browser.*: 複雑なインタラクションのための完全なブラウザ制御。 - ナビゲート、クリック、入力、スクロール、スクリーンショットの撮影など。

WebデータAPI(60以上の構造化データセット):

  • Eコマース: web_data_amazon_product, web_data_walmart_product, web_data_ebay_product, web_data_etsy_products, web_data_bestbuy_products, web_data_zara_products
  • ソーシャルメディア: web_data_linkedin_person_profile, web_data_instagram_profiles, web_data_facebook_posts, web_data_tiktok_profiles, web_data_x_posts, web_data_reddit_posts
  • ビジネスインテリジェンス: web_data_linkedin_company_profile, web_data_crunchbase_company, web_data_zoominfo_company_profile
  • 検索とレビュー: web_data_amazon_product_search, web_data_amazon_product_reviews, web_data_google_maps_reviews, web_data_facebook_company_reviews
  • 地図とローカル: web_data_google_maps_reviews, web_data_zillow_properties_listing, web_data_booking_hotel_listings
  • アプリストア: web_data_google_play_store, web_data_apple_app_store
  • メディアとニュース: web_data_youtube_videos, web_data_youtube_comments, web_data_reuter_news
  • 開発者ツール: web_data_github_repository_file
  • 金融: web_data_yahoo_finance_business

すべてのWebデータAPIツールは、キャッシュされた、または最新の構造化データをJSON形式で返し、多くの場合、リアルタイムのスクレイピングよりも信頼性が高くなります。

構成オプション

Bright Data MCPサーバーは、カスタマイズのためにいくつかの環境変数をサポートしています。

変数 説明 デフォルト
API_TOKEN Bright Data APIトークン(必須) -
PRO_MODE 60以上のすべての高度なツールを有効にする false
RATE_LIMIT カスタムレート制限(例: "100/1h"、"50/30m") 制限なし
WEB_UNLOCKER_ZONE カスタムWeb Unlockerゾーン名 mcp_unlocker
BROWSER_ZONE カスタムブラウザAPIゾーン名 mcp_browser

追加リソース