AIクローラーアクセステスター: Lumosが毎週各ページで実行している同じテスト
リアルタイムのボットアクセステスト — Lumosが毎週サイト全体で実行しているものと同じです。
執筆: Lumosチーム · 2026年5月15日
なぜクローラー アクセスが GEO の最初の関門なのか
AI エンジンがあなたのページを引用するには、まず読む必要があります。 ChatGPT 、 Claude 、 Gemini 、 Perplexity はそれぞれ固有の user-agent 文字列と目的を持つクローラーを送り出し、いずれもコンテンツを取得する前に robots.txt を確認します。そこでブロックされていたら、他は何も意味を持ちません。スキーマも、 llms.txt も、文章の質も無関係です。あなたは見えません。
2026 年に Lumos が監査した 1,000 のミッドマーケット サイトでは、 41% が 13 種の主要な AI クローラーのうち少なくとも 1 つを誤ってブロックしていました。よくある犯人は次のとおりです。
- ステージング サイトから残った
User-agent: *Disallow: /。 - デフォルトで有効化されている Cloudflare のボット保護トグル。
- AI ボットが網にかかっていることに誰も気づかないまま「サイトを保護した」 CMS プラグイン。
- 数年前に追加された汎用的な
Disallowルール。 - WAF のヒューリスティックによる誤検知。
このツールが確認する 13 の AI クローラー
各ボットには特定の役割があり、すべて許可すべきサイトもあれば、サブセットを正当な理由でブロックするサイトもあります。
GPTBot— OpenAI の学習クローラー。将来の GPT モデルを訓練するためにページを読みます。OAI-SearchBot— ChatGPT のリアルタイム検索クローラー。 ChatGPT の回答であなたが引用されるのはこれです。ChatGPT-User— ChatGPT ユーザーが回答内のリンクをクリックしたときに発火。ClaudeBot— Anthropic の Claude 用メイン クローラー。anthropic-ai— Anthropic の学習クローラー(ClaudeBotとは別)。Claude-Web— Claude がユーザーの代わりにページを訪れる際に使う user-agent 。PerplexityBot— Perplexity のメイン クローラー。Perplexity-User— Perplexity ユーザーがリンクをクリックしたときに発火。Google-Extended— Gemini 学習のオプトアウト フラグ。Googlebot— クラシック Google + AI Overviews と Bard / Gemini のリアルタイム回答の源。Applebot-Extended— Apple Intelligence 学習のオプトアウト。Bingbot— Bing + Copilot 。Bytespider— TikTok / Doubao の学習クローラー。
良い結果の見え方
GEO 最適化済みのサイトでは、ルート パス上の 13 ボットすべてが**「許可」**を示します。例外は次のとおりです。
- 一部のブランドは意図的に
GPTBot、anthropic-ai、Google-Extended、Applebot-Extended(学習用)をブロックし、リアルタイム系(OAI-SearchBot、ChatGPT-User、ClaudeBot、PerplexityBot、Googlebot、Bingbot)は許可したままにします。これが「学習からはオプトアウト、引用にはオプトイン」のパターンです。 - 西側の AI エンジンに影響を与えずに TikTok 学習を避けるため
Bytespiderをブロックするブランドもあります。
すべて「許可」と表示されていれば、最初の関門は突破済みです。ブロックがあれば修正してください。
よくある間違い
User-agent: *の Disallow で誤ってブロック。 一括の disallow は AI クローラーを含むすべてのボットを捕まえます。上記の AI user-agent に明示的な Allow ルールを追加してください。GPTBotをブロックしてOAI-SearchBotは許可しないまま。 よくあるパターンですが、意図しているか確認してください。 ChatGPT 可視性が目的なら重要なのはOAI-SearchBotです。- Cloudflare の AI ボット トグル。 2024 年に Cloudflare のダッシュボードに「 AI ボットをブロック」トグルが追加され、新規サイトではデフォルトで ON です。 robots.txt がいくら Allow と言っても、 Cloudflare は 403 を返します。
- robots.txt を HTML や認証越しで配信。 いずれも AI クローラーを諦めさせます。
text/plainと公開アクセスを強制してください。 - 古いルール。 2018 年の robots.txt には 2023-2024 年に登場した AI user-agent への言及がありません。
- 1 つのパスの結果を信頼しすぎる。 このテスターはルート(
/)を確認します。/blogや/docsで AI ボットをブロックしている場合、それらのパスもテストする必要があります。 - WAF のレート リミット。 厳しすぎるレート リミットは、 AI クローラーを実質的にブロックします。
テスト後にやること
- 13個すべてが「許可」と表示される場合: ルートのrobots.txtレイヤーをクリアしました。スキーマ、引用適性、パスごとのチェックに進みましょう。
- いずれかが「ブロック」と表示される場合: robots.txtを編集して、ブロックされたユーザーエージェント向けに明示的な
Allow:ルールを追加し、このテスターを再実行してください。 - robots.txtで許可していてもCDNやWAFがブロックする場合: Cloudflare → セキュリティ → ボット → 「AI Scrapers and Crawlers」を確認。Akamai/Impervaでは「AI」「scraper」とタグ付けされたbot managementルールを探してください。
- ページごとの引用適性チェッカーと組み合わせて使ってください — アクセスは必要条件ですが十分ではありません。
Lumosが継続的に行っていること(このワンショットテストとの違い)
このページはオンデマンドでルートをテストします。便利ですが、スナップショットです。Lumosプラットフォームは同じテストを継続的なインフラとして実行します:
/だけでなくサイト内の全URL。 ここでは/がチェックされます。Lumosは発見した全URL(ブログ記事、商品ページ、ドキュメント、サイトマップにあるすべて)に対して13ボットテストを実行します。リグレッションはそこに隠れます:/は開いているのに/blogがブロックされている、といった具合です。- 思い出した時ではなく、毎週。 設定はドリフトします。CMSプラグインが更新され、Cloudflareのトグルがオンになり、コンテンツチームがルールを追加します。Lumosは毎週フルテストを再実行するので、変更を四半期単位ではなく数日で発見できます。
- 当日のアラート。 13ボットのいずれかが「許可」から「ブロック」に変わった瞬間、Lumosは差分とともにアラートを送ります — どのボット、どのパス、robots.txtやネットワーク応答で何が変わったか。「3ヶ月前にChatGPTのトラフィックが落ちたことに気づきました」とはもう言いません。
- robots.txt + ネットワーク層を1つのレポートに。 このスタンドアロンツールはrobots.txtだけを検査します。Lumosプラットフォームは各URLを各ユーザーエージェントとして取得し、実際のHTTP応答も報告します — Cloudflareの403やWAFブロックがrobots.txtルールと並んで表示されます。
- 引用・可視性データと連動。 ボットがブロックされた日を、Lumosはそのエンジンでの可視性スコアと相関させます — 技術イベントだけでなく、ビジネスへの影響が見えます。
このスタンドアロンツールは同じロジックを、一度だけルートで実行するものです。継続的な、URL単位の、アラート付きバージョンが欲しい方には、Lumosプラットフォームがそのために作られています。
41%
少なくとも 1 つの AI クローラーをブロックしているサイトの割合
Lumos 調査 2026
13
このツールが確認する AI クローラー数
Lumos
How it works
- 1
ドメインを入力
完全なドメイン(例: yourbrand.com)を貼り付けます。パスは不要。
- 2
「テスト」をクリック
/robots.txt を取得し、ルート パスに対して 13 種の AI user-agent を評価します。
- 3
結果を確認
各ボットを「許可」「ブロック」「部分的」として報告。ボット別ルールを掘り下げられます。
- 4
ブロックを修正
AI 向け robots.txt ジェネレーターで修正版を作り、再テストします。
FAQ
このツールは何を確認しますか?
robots.txtを取得し、13種のAIユーザーエージェントに対してテストします — GPTBot、OAI-SearchBot、ChatGPT-User、ClaudeBot、anthropic-ai、Claude-Web、PerplexityBot、Perplexity-User、Google-Extended、Googlebot、Applebot-Extended、Bingbot、Bytespider。それぞれ「許可」「ブロック」として報告されます。Lumosプラットフォームは同じテストを、サイトの全ページで継続的に実行します — ルートで1度だけではありません。
Lumosが継続的に行っていることとどう違いますか?
このワンショットテストはオンデマンドでルートパスを確認します。Lumosプラットフォームは、サイトの全URLに対して同じ13ボットテストを毎週実行し、変更を監視し、いずれかのボットがブロックされた日に通知します — Cloudflareのトグルやプラグインがルールを静かに変えた時も含みます。同じテスト、フルカバレッジ、常時稼働です。
ブロック解除だけで引用されますか?
いいえ。アクセスは必要ですが十分ではありません。AIエンジンはコンテンツが引用に値することも求めます:明確な回答、スキーマ、新しい日付、信頼できる著者性。Lumosプラットフォームは継続的なボット監視とページレベルの引用適性スコアを組み合わせ、全体像を提供します。
CloudflareやWAFのネットワーク層でのブロックはどうですか?
robots.txtは一層に過ぎません。CloudflareのAIボットトグル、Akamai bot manager、カスタムWAFルールはrobots.txtが許可していてもAIクローラーをブロックできます。Lumosの有料プラットフォームは両層を継続的にチェック — robots.txt + 各ユーザーエージェントの実際のHTTPレスポンス。
なぜ一部のボットが「部分的」と表示されますか?
一部のユーザーエージェントには細かいルールがあります — 例:サイトが/ではGPTBotを許可するが/apiや/adminをブロックする場合。許可/ブロック/部分的として報告し、門が大きく開いているのかホームだけかを示します。Lumosプラットフォームはサイトの全パスをチェックし、ルートだけにとどまりません。
Lumosはこれを継続的に監視しますか?
はい — Lumosプラットフォームは毎週全URLに対してこのチェックを実行し、いずれかのボットがブロックされた日にアラートを送ります。このスタンドアロンツールはワンショットのルートだけのバージョンです。Lumosにサイトを接続して継続的なカバレッジを取得してください。
関連ツール
関連記事
GEO:AI時代のSEO
Generative Engine Optimization(GEO):指標、評価基準、30日のパイロットで、ChatGPTやGeminiが語るブランドを監視する方法。
ChatGPTはあなたの企業を何と言っているか?AI可視性の監査方法
ChatGPT、Gemini、Perplexityが自社について何を言っているか把握できていますか?問題が顧客を失う前にAI可視性を監査する方法を学びましょう。
GEOとは?Generative Engine Optimizationの完全ガイド
GEO(Generative Engine Optimization)とは、ChatGPT・Gemini・PerplexityなどAI検索でブランドを表示させる最適化手法です。