気づいたら変わっていました
ふとGoogle Search Consoleを見てみたら、はてなブログのsitemap.xml
の内容が変わっていました。特にアナウンスは無かったですが、日にち的に2020年4月1日からの変更でしょうか。少し掘り下げてみます。
実際のファイルを調べる
どう変わったのか?
最新のsitemap.xml
ファイルの実物を見てみましょうか。
はてなブログの場合、サイトマップファイル(sitemap.xml)は、ここに自動で置かれます。
<sitemapindex> <sitemap> <loc>https://kanaxx.hatenablog.jp/sitemap_common.xml</loc> <lastmod>2020-04-05T22:02:56+09:00</lastmod> </sitemap> <sitemap> <loc> https://kanaxx.hatenablog.jp/sitemap_periodical.xml?year=2020&month=4 </loc> <lastmod>2020-04-05T22:02:56+09:00</lastmod> </sitemap> <sitemap> <loc> https://kanaxx.hatenablog.jp/sitemap_periodical.xml?year=2020&month=3 </loc> <lastmod>2020-04-05T22:02:56+09:00</lastmod> </sitemap> <sitemap> <loc> https://kanaxx.hatenablog.jp/sitemap_periodical.xml?year=2020&month=2 </loc> <lastmod>2020-04-05T22:02:56+09:00</lastmod> </sitemap> </sitemapindex>
とってもシンプルになりましたね。
sitemap_index.xmlも同じ形式のファイルです。
新しいサイトアップの構成
sitemap.xml
が全体のサイトマップの定義(サイトマップインデックスファイル)で、その中で3種類のサイトマップファイルを指し示しています。
sitemap_common.xmlは、ブログトップページとaboutページの2つのURLだけ載っているサイトマップファイルです。このファイルが読み込まれていなくても、あまり気にすることはないです。URLはたった2つだけですし。
sitemap_periodical.xmlは、ブログのエントリー(記事)用のサイトマップファイルです。これが一番重要なサイトマップファイルです。
記事作成時の日付をもとにして、年月でファイルが分割されます。つまり、月替わりごとに追いかける必要があるということですね。
sitemap_page.xmlは、PRO版で使える固定ページのURLが載っているサイトマップファイルです。
廃止になったもの
今回の変更で、sitemap.xml?page=1
、sitemap.xml?page=2
というページ番号で区切っていく形式のサイトマップURLは使わなくなりました。
この形式のURLにアクセスしてもエラーにはならず、サイトマップ形式のXMLデータが返ってきます。過去に使っていた人向けに使える状態にしてあるだけなので、新しく使う人はわざわざ必要はありません。
サーチコンソールで確認する
で、Google Search Consoleで見てみるわけですが、、、相変わらず上手く取得できないみたいです。sitemap.xmlは見つかるけど、その先の個別のサイトマップファイルが読めない状態ですね。 「取得できませんでした」のエラーメッセージが出ますね。これはもう見飽きました。
ブラウザでアクセスするとちゃんと存在はしているのですけどね。なんてこったい。
とりこまれにくい問題は解決せず
サイトマップの構成は変わりましたが、取り込まれ具合は今までと変わっていません。はてなブログはGoogleからのアクセスをちゃんと受け止めきれないみたいです。
こればっかりは、はてな側が問題を解決してくれないとどうにもならないです。Googleにちゃんとインデックスされないとはてなが損するはずなので、対応したほうがいいと思うんだけどなぁ。
ま、せっかく構成を変えるなら、sitemap_common.xml
の中に/archive/category
のURLも置いてくれればよかったのに。中途半端だな。残念。
サイトマップ関係の追加の作業
サイトマップが取り込まれないのが納得いかないので、いろいろと試行錯誤してみました。悪あがきです。
sitemap_index.xmlを登録するのが正式っぽいという話です
(実際のところは、sitemap.xmlとsitemap_index.xmlは同じものなので、見違える変化は得られません。)結果が同じだとしても正しいことをするのが正しいです。
kanaxx.hatenablog.jp
複数のsitemapをサチコに直接登録してしまおうという話です
サイトマップインデックスファイルを登録するだけでいいはずなのに、個別にバラバラに登録するといいことがあるかな?の確認作業です。 kanaxx.hatenablog.jp
上の作業が面倒なので、sitemap登録作業を自動化してしまおうという話です
サイトマップを個別に登録するのをAPIを使って自動的に済ませました。すごく楽になりました。 kanaxx.hatenablog.jp
これで、オールグリーンも夢じゃない
最後に
今日はここまでです。
サイトマップが取り込まれなくてイライラしているひとに参考になるといいなぁ。
参考にした資料
サイトマッププロトコル
https://www.sitemaps.org/ja/protocol.html