Notion製ブログ公開時、Super.soで生成されたsitemap.xmlをSearch Consoleに提出しようとしたところ、「取得できませんでした」というエラー。
Super.so × NotionブログのデメリットとテクニカルSEO面2つの不満 の記事でも言及している、Notion製ブログはXMLサイトマップをSearch Consoleに提出できない、という問題です。
ほとんどの場合、Search ConsoleでのXMLサイトマップ「取得できませんでした・読み込めませんでした」エラーの正体は、「保留中」が本来のステータスであるところが、誤って異なるメッセージのエラーとして表示されてしまっているというもの。Search Console側でのバグのようです。
Sitemap could not be read in new GSC - Google Search Central Community
ただし、robot.txtにDisallow設定でクローラに辿らせない設定をしている場合などは別。Search Consoleライブテスト等で確認しましょう。
以下、状況と調査内容について詳細を書き残しておきます。
目次:
下画像のように、XMLサイトマップを提出したところ、「取得できませんでした」が表示されました。
さらにクリックして詳細を見てみると、「サイトマップが読み込めませんでした」というエラー表示となっています。
ブラウザからアクセスした際にはXML形式でのサイトマップを閲覧することができているので、Search Consoleからの読み取り時に何か起きているのでは、と推察。
XMLサイトマップをブラウザから閲覧した画面
まずは「サイトマップが読み取れない仕様になっていないか?」をSearch Consoleのライブテスト機能を使ってチェックします。
たとえばrobot.txtにサイトマップファイルを辿らせない設定(Disallow)をしていると、GoogleのクローラがXMLサイトマップをたどることができません。
検索パフォーマンス > 上欄のURLでsitemap.xmlファイルのURL > 右上の「公開URLをテスト」
結果は登録の可否詳細が
クロールを許可?: はい(robot.txtなどでブロックされている訳ではない)
ページの取得: 成功
となっており、sitemap.xml側を設置しているホスト側に何か問題があるようでもありませんでした。