XMLサイトマップとは？設定方法・よくある設定ミスまで徹底解説

2026年4月20日2026年4月24日

URLをコピーしました！

「XMLサイトマップを送信しているのにインデックスが増えない」「サイトマップを正しく設定できているか不安」——そんな悩みを持つWeb担当者は多くいます。

結論からお伝えすると、サイトマップSEOで最初にやるべきことは「何を入れるか」ではなく「何を入れてはいけないか」の整理です。

この記事では、XMLサイトマップの基本から、よくある設定ミス、インデックスされない場合の対処法、さらに2026年時点で必要な「llms.txtとの2系統設計」まで実務視点で解説します。

XMLサイトマップとは何か？SEOにおける役割を理解する

XMLサイトマップとは、Googleなどの検索エンジンに「このサイトにはどんなURLがあるか」を伝えるファイルです。クローラーが自力で見つけにくいページを効率よく巡回させるための「地図」として機能します。

サイトの規模が大きくなるほど、クローラーは全ページを自力で発見しにくくなります。

内部リンクが少ないページや、公開したばかりの新しい記事は特に見落とされやすい。XMLサイトマップを使うことで、こうしたページをGoogleに直接通知できます。

XMLサイトマップとHTMLサイトマップの違い

種類	対象	目的
XMLサイトマップ	検索エンジン（クローラー）	クロールの効率化・インデックス促進
HTMLサイトマップ	ユーザー	サイト内のナビゲーション補助

XMLサイトマップは検索エンジン向けのファイルであり、ユーザーが直接閲覧するものではありません。

SEO目的では、XMLサイトマップをGoogle Search Consoleに送信することが基本です。

Googleがサイトマップを必要とするのはどんなサイトか

Googleの公式ガイドラインでは、以下のようなサイトでサイトマップが特に有効とされています。

ページ数が500以上の大規模サイト
外部からのリンクが少ない新しいサイト
動画・画像など特殊なコンテンツが多いサイト
内部リンク構造が複雑なサイト

逆に、小規模で内部リンクが充実したサイトであれば、サイトマップがなくても問題ない場合があります。ただし、送信しておいてデメリットはないため、規模を問わず設定することを推奨します。

XMLサイトマップに「入れていいページ」と「入れてはいけないページ」

XMLサイトマップには、インデックスしてほしい正規URLだけを含めるのが原則です。何でもURLを入れればいいわけではなく、不要なページを含めるとクロールバジェットを無駄に消費し、サイト全体の評価に悪影響を与えます。

必ず含めるべきページの条件

以下の条件を満たすページのみをサイトマップに含めます。

インデックスさせたいページ（noindexが設定されていない）
正規URL（canonicalで自己参照されている）
200ステータスで正常に返却されているページ
重複コンテンツではないオリジナルページ

除外すべきページ一覧（noindex・404・低品質アーカイブ）

以下のページはサイトマップから除外します。

除外すべきページ	理由
noindexが設定されているページ	インデックス拒否とサイトマップ登録が矛盾するシグナルになる
404・410エラーページ	存在しないURLをGoogleに通知してしまう
タグアーカイブページ	低品質・重複コンテンツになりやすい
著者アーカイブページ	同上
WordPressの添付ファイルページ	薄いコンテンツでSEO上の価値がない
301リダイレクト先でない旧URL	古いURLをクロールさせる無駄が生じる

よくある設定ミス3パターンと確認方法

実務でよく見かける設定ミスを3つ紹介します。

ミス①：noindexページがサイトマップに残っている

タグアーカイブや著者アーカイブをnoindexに設定したにもかかわらず、サイトマップ側の除外設定を忘れるケースです。

Googleからするとnoindexとサイトマップ登録が矛盾したシグナルになり、クロールバジェットを無駄に消費します。WordPressプラグインの設定でnoindexにした場合、サイトマップからの除外も同じプラグイン内で行う必要があります。

ミス②：削除した記事のURLがサイトマップに残り続ける

CMS上で記事を削除した後、サイトマップが再生成されないまま古いURLが残るケースです。

Google Search Consoleに404のURLを送信し続けることになり、クロールエラーの原因になります。削除後はサイトマップを再生成・再送信することを徹底してください。

ミス③：複数のサイトマップファイルで重複URLが発生している

SEOプラグインとWordPressデフォルトのサイトマップが混在し、同じURLが複数のサイトマップに登録されているケースです。

使用するサイトマッププラグインは1つに統一し、不要なサイトマップはGoogle Search Consoleから削除してください。

Googleサーチコンソールへの送信手順と確認方法

XMLサイトマップはGoogle Search Consoleから送信することで、Googleに正式に認識させることができます。

送信しなくてもGoogleがサイトマップを自動検出する場合がありますが、明示的に送信するほうが確実です。

サイトマップの送信ステップ

Google Search ConsoleにログインしてプロパティとなるサイトURLを選択
左メニューの「インデックス」→「サイトマップ」を開く
「新しいサイトマップを追加」欄にサイトマップURLを入力
「送信」ボタンをクリック

送信するURLにはサイトマップインデックスファイルを指定します。

一般的なサイトマップURLは https://example.com/sitemap.xml が標準です。個別ファイルを1つずつ送信する必要はありません。

送信後にGoogle Search Consoleで確認すべき3つのポイント

送信後は以下の3点を確認します。

ステータスが「成功」になっているか：エラーが出ている場合はサイトマップファイルの形式や到達性を確認
検出URLと送信URLの乖離が大きくないか：大きな差がある場合はnoindexページの混入や設定ミスを疑う
最終読み取り日時が更新されているか：古いままの場合はサイトマップが正常に更新されていない可能性がある

サイトマップを送信してもインデックスされないときの対処法

サイトマップを送信してもインデックスされない場合、原因の大半はコンテンツ品質の問題です。 サイトマップはあくまでGoogleへの「通知」であり、インデックスを保証するものではありません。

「検出 – インデックス未登録」と「クロール済み – インデックス未登録」の違い

Google Search Consoleのページインデックスレポートには複数のステータスがあります。対処法はステータスによって異なります。

ステータス	意味	主な対処法
検出 – インデックス未登録	Googleが存在を認識したがまだクロールしていない	サイトマップ再送信・内部リンク強化でクロールを促す
クロール済み – インデックス未登録	クロールしたがインデックスしないと判断した	コンテンツ品質・重複・canonical設定を見直す

「クロール済み – インデックス未登録」はGoogleが意図的に判断した結果であり、サイトマップの送信だけで解決しません。コンテンツそのものの改善が必要です。

原因①：重複コンテンツ・canonical設定の問題

同じ内容のページが複数のURLで存在している場合、Googleはどちらをインデックスするか判断に迷います。

canonical（rel=”canonical”）が正しく設定されているかを確認し、複数URLで同じコンテンツが表示されないよう整理します。

原因②：301リダイレクト設定漏れ

旧URLから新URLへのリダイレクトが設定されていない場合、Googleが旧URLと新URLを別ページと認識します。

リダイレクト漏れはサイトマップ登録の問題より根本的な原因になるため、移行時には必ず確認します。

原因③：コンテンツ品質がGoogleの基準を満たしていない

実務で最も多いインデックスされない原因は、コンテンツの品質不足です。

情報量が薄い・他サイトとほぼ同じ内容・ユーザーの検索意図に合っていない——こうしたページはGoogleが意図的にインデックスしない判断をします。「サイトマップに入れれば解決する」という誤解が多いですが、この場合の根本対策はコンテンツ自体の充実です。

2026年版：XMLサイトマップとllms.txtの2系統設計という考え方

2026年現在、クローラーは大きく2種類に分かれています。

GoogleなどのSEOクローラーと、ChatGPT・ClaudeなどのAIクローラーです。XMLサイトマップはGooglebot向けの地図ですが、AIクローラーには別の仕組みが必要です。この2系統を意識した設計が、AIO（AI検索最適化）対策として重要になっています。

GooglebotとAIクローラーは「別の地図」が必要

AIクローラーはXMLサイトマップを参照しません。AIクローラー向けには、llms.txtというテキストファイルで「このサイトにある情報の概要」を伝える新しい仕組みが広まっています。

対象	使うファイル	役割
Googlebot（SEO）	XMLサイトマップ	クロール対象URLの地図
AIクローラー（AIO）	llms.txt	サイト概要とコンテンツ構造の説明

この2系統を整備することで、Google検索とAI検索の両方で適切に情報を参照・引用してもらえるサイト設計が実現します。

robots.txtでAIクローラーへのアクセスを明示的に許可する設定

llms.txtを設置するだけでなく、robots.txtでAIクローラーのアクセスを許可・制御することも重要です。主なAIクローラーのUser-Agent名は以下の通りです。

GPTBot（OpenAI）
OAI-SearchBot（ChatGPT検索）
PerplexityBot（Perplexity）
ClaudeBot（Anthropic）

AIに参照してほしいコンテンツがある場合は、robots.txtでこれらのクローラーへのアクセスをDisallowではなくAllowの状態に保つ必要があります。意図せずAIクローラーをブロックしているケースが実務では少なくありません。

まとめ

この記事のポイントを整理します。

XMLサイトマップの本質は「インデックスしてほしいURLを正確にGoogleに伝えること」。
よくある設定ミスはnoindexとサイトマップの矛盾・削除済みURLの残存・複数サイトマップでの重複の3パターン
Google Search ConsoleでのステータスはGoogleの判断を反映しており、「クロール済み – インデックス未登録」はコンテンツ品質の改善が必要なサイン
サイトマップは通知手段であり、保証手段ではない

まずはGoogle Search Consoleでサイトマップのステータスを確認することから始めてみてはいかがでしょうか。

よくある質問（FAQ）

Q. サイトマップは必ず作らないといけませんか？

サイトマップは必須ではありませんが、設定しておくことを強く推奨します。特にページ数が多いサイト・新しいサイト・内部リンクが少ないページが多いサイトでは、サイトマップがないとGoogleがページを発見しにくくなります。デメリットはほぼないため、作成するのをお勧めします。

Q. サイトマップに登録したら必ずインデックスされますか？

サイトマップへの登録はインデックスを保証しません。サイトマップはGoogleへの「通知」であり、最終的にインデックスするかどうかはGoogleが判断します。コンテンツ品質・重複の有無・canonical設定などが適切でない場合、サイトマップに登録してもインデックスされないことがあります。

Q. サイトマップの更新頻度はどのくらいが適切ですか？

サイトマップは新しい記事を公開するたびに自動更新される設定が理想です。WordPressのSEOプラグインを使っていれば、記事を公開・更新するたびにサイトマップが自動再生成されます。手動で管理している場合は、コンテンツを追加・削除するたびに更新・再送信を行ってください。

Q. サイトマップに登録できるURLの上限はありますか？

1つのサイトマップファイルには最大50,000URL・ファイルサイズ50MBという制限があります。URLがこれを超える場合は、サイトマップインデックスファイルを使って複数のサイトマップファイルに分割します。主要なSEOプラグインはこの分割を自動で処理します。

URLをコピーしました！