Notion製ブログ公開時、Super.soで生成されたsitemap.xmlをSearch Consoleに提出しようとしたところ、「取得できませんでした」というエラー。

Super.so × NotionブログのデメリットとテクニカルSEO面2つの不満 の記事でも言及している、Notion製ブログはXMLサイトマップをSearch Consoleに提出できない、という問題です。

ほとんどの場合、Search ConsoleでのXMLサイトマップ「取得できませんでした・読み込めませんでした」エラーの正体は、「保留中」が本来のステータスであるところが、誤って異なるメッセージのエラーとして表示されてしまっているというもの。Search Console側でのバグのようです。

Sitemap could not be read in new GSC - Google Search Central Community

ただし、robot.txtにDisallow設定でクローラに辿らせない設定をしている場合などは別。Search Consoleライブテスト等で確認しましょう。

以下、状況と調査内容について詳細を書き残しておきます。

目次:

Search ConsoleでのXMLサイトマップ提出時「取得できませんでした・読み込めませんでした」エラーが発生

下画像のように、XMLサイトマップを提出したところ、「取得できませんでした」が表示されました。

Screen Shot 2021-11-04 at 18.16.08.png

さらにクリックして詳細を見てみると、「サイトマップが読み込めませんでした」というエラー表示となっています。

Screen Shot 2021-11-03 at 14.20.47.png

ブラウザからアクセスした際にはXML形式でのサイトマップを閲覧することができているので、Search Consoleからの読み取り時に何か起きているのでは、と推察。

XMLサイトマップをブラウザから閲覧した画面

XMLサイトマップをブラウザから閲覧した画面

まずはライブテストでサイトマップが本当に読み込み不可かどうかを確認

まずは「サイトマップが読み取れない仕様になっていないか?」をSearch Consoleのライブテスト機能を使ってチェックします。

たとえばrobot.txtにサイトマップファイルを辿らせない設定(Disallow)をしていると、GoogleのクローラがXMLサイトマップをたどることができません。

検索パフォーマンス > 上欄のURLでsitemap.xmlファイルのURL > 右上の「公開URLをテスト」

Screen Shot 2021-11-04 at 18.19.44.png

結果は登録の可否詳細が

クロールを許可?: はい(robot.txtなどでブロックされている訳ではない)

ページの取得: 成功

となっており、sitemap.xml側を設置しているホスト側に何か問題があるようでもありませんでした。

Screen Shot 2021-11-04 at 18.20.16.png

Search Console上にあるXMLサイトマップを一旦すべて削除