心配性なシステム運用日記 | 【SEO】AIエージェント一覧とrobots.txt戦略

こんにちは。

WebサイトをいかにAIサービスやチャットを介してアクセスを獲得するかという点で、何の自動クローニングを許可するかを記載するrobots.txtの設定が重要な昨今となっています。 AIサービスが普及した昨今、「どのAIに、どの目的で、どこまでデータを渡すか」を戦略的に決め、robots.txtの設定を行う必要があります。

今回は、主要AIサービスの整理と、AIサービスからのアクセスを3用途に分け、用途ごとにSEOや流入にどう影響するかについて解説します。

1. AIエージェントからのアクセス「3パターン」

AIがサイトを訪れる目的は1つではなく、大きく分けて以下の3つのパターンが存在すると考えられます。

用途・目的の定義マトリックス

用途	チャット内での具体的な動作	SEO・サイト流入への影響
検索用	質問に対し、Web検索を行って回答を生成する際に動作。回答内に出典URLが表示。	その出典URLをクリックすることで、直接的な流入に直結。
ユーザ用	ユーザーが「この記事を要約して」と、特定のURLを貼り付けた際に動作。	AIによるアクセスはカウント対象外となるが、記事の理解を助け拡散や再訪を促すため、間接的にはSEOへ寄与。
学習用	チャット時の動作ではなく、裏側でのモデル学習用として使用。	流入には繋がらない可能性が高い。回答を機にユーザが再検索し来訪する望みはあるが、AIチャット内で完結し流入が減る可能性が高い。

2. 主要AIサービス：User-agent 最新比較表

各社、用途ごとにUser-agentのリストを作成しました。

会社名	エージェント名 (User-agent)	用途	参照URL (ソース)
OpenAI	OAI-SearchBot	検索用	platform.openai.com
	ChatGPT-User	ユーザ用	platform.openai.com
	GPTBot	学習用	platform.openai.com
Calude Code	Claude-SearchBot	検索用	support.claude.com
	Claude-User	ユーザ用	support.claude.com
	ClaudeBot	学習用	support.claude.com
Google	Googlebot	検索用	developers.google.com
	Google* (ワイルドカード)	ユーザ用	developers.google.com
	Google-Extended	学習用	developers.google.com
Perplexity	PerplexityBot	検索用	docs.perplexity.ai
	Perplexity-User	ユーザ用	docs.perplexity.ai
Microsoft	bingbot	検索用	momenticmarketing.com
GitHub	検索用としてbingbotを使用	検索用	docs.github.com
Grok	※他エージェント名によるステルス収集のため特定困難	検索/ユーザ/学習	momenticmarketing.com

※記載のないエージェントは情報が確認できませんでした。

3. AIエージェントを考慮したSEO対策：アクセスと知財のバランス

robots.txtを設定する際、 「検索用は必須で開ける、ユーザ用はなるべく、学習用は任意で」 という基本戦術となるかと思います。

攻めの運用（SEO重視）

SEOを重視するうえでは、AIによる回答内に参照URLを返すために「検索用」は必須です。加えて、Webサイトに引き込む可能性を少しでも高めるために、ユーザが拡散・独自検索することも視野に入れ、「ユーザ・学習用」も許可することが重要だと考えます。

守りの運用（知財重視）

一方で、コンテンツを丸ごと吸収してしまう 「学習用」はゼロクリック検索を強める要因にもなり、組織によっては公開情報を汎用モデルに読み込ませたくない場合もあります。その場合、「学習用」をブロックし、「検索用・ユーザ用」を許可するのをするのがいいと考えます。

4. robot.txt記載例

# --------------------------------------------------
# 【守りの運用】特定の学習用ボットのみ拒否し、他はすべて許可
# --------------------------------------------------

# 1. OpenAI学習用拒否
User-agent: GPTBot
Disallow: /

# 2. Claude学習用拒否
User-agent: ClaudeBot
Disallow: /

# 3. Google学習用拒否
User-agent: Google-Extended
Disallow: /

# 4. それ以外の検索用・ユーザ用を許可
User-agent: *
Allow: /

# サイトマップの指定
Sitemap: https://<mypage.com>/sitemap.xml

※攻めの運用の場合は、1~3の拒否を削除し、All Allowします。

おわりに

AIエージェントを考慮した、Robot.txtの記載方法について考察してきました。 Robot.txtの設定次第で、SEOに大きく影響してくるため、これを機に改めて設定を確認してみるのもいいかもしれません。

それでは。