『7回目の出直し🌻』

好きなことを自分のペースで、のんびり更新

【2020年4月~】はてなブログのサイトマップの形式が変わりました。

気づいたら変わっていました

ふとGoogle Search Consoleを見てみたら、はてなブログのsitemap.xmlの内容が変わっていました。特にアナウンスは無かったですが、日にち的に2020年4月1日からの変更でしょうか。少し掘り下げてみます。

実際のファイルを調べる

どう変わったのか?
最新のsitemap.xmlファイルの実物を見てみましょうか。

はてなブログの場合、サイトマップファイル(sitemap.xml)は、ここに自動で置かれます。

<sitemapindex>
<sitemap>
<loc>https://kanaxx.hatenablog.jp/sitemap_common.xml</loc>
<lastmod>2020-04-05T22:02:56+09:00</lastmod>
</sitemap>
<sitemap>
<loc>
https://kanaxx.hatenablog.jp/sitemap_periodical.xml?year=2020&month=4
</loc>
<lastmod>2020-04-05T22:02:56+09:00</lastmod>
</sitemap>
<sitemap>
<loc>
https://kanaxx.hatenablog.jp/sitemap_periodical.xml?year=2020&month=3
</loc>
<lastmod>2020-04-05T22:02:56+09:00</lastmod>
</sitemap>
<sitemap>
<loc>
https://kanaxx.hatenablog.jp/sitemap_periodical.xml?year=2020&month=2
</loc>
<lastmod>2020-04-05T22:02:56+09:00</lastmod>
</sitemap>
</sitemapindex>

とってもシンプルになりましたね。
sitemap_index.xmlも同じ形式のファイルです。

新しいサイトアップの構成

sitemap.xmlが全体のサイトマップの定義(サイトマップインデックスファイル)で、その中で3種類のサイトマップファイルを指し示しています。

sitemap_common.xml

sitemap_common.xmlは、ブログトップページとaboutページの2つのURLだけ載っているサイトマップファイルです。このファイルが読み込まれていなくても、あまり気にすることはないです。URLはたった2つだけですし。

sitemap_periodical.xml

sitemap_periodical.xmlは、ブログのエントリー(記事)用のサイトマップファイルです。これが一番重要なサイトマップファイルです。

記事作成時の日付をもとにして、年月でファイルが分割されます。つまり、月替わりごとに追いかける必要があるということですね。

sitemap_page.xml

sitemap_page.xmlは、PRO版で使える固定ページのURLが載っているサイトマップファイルです。

廃止になったもの

今回の変更で、sitemap.xml?page=1sitemap.xml?page=2というページ番号で区切っていく形式のサイトマップURLは使わなくなりました
この形式のURLにアクセスしてもエラーにはならず、サイトマップ形式のXMLデータが返ってきます。過去に使っていた人向けに使える状態にしてあるだけなので、新しく使う人はわざわざ必要はありません。

サーチコンソールで確認する

で、Google Search Consoleで見てみるわけですが、、、相変わらず上手く取得できないみたいです。sitemap.xmlは見つかるけど、その先の個別のサイトマップファイルが読めない状態ですね。 「取得できませんでした」のエラーメッセージが出ますね。これはもう見飽きました。

f:id:kanaxx43:20200406184307p:plain

ブラウザでアクセスするとちゃんと存在はしているのですけどね。なんてこったい。

とりこまれにくい問題は解決せず

サイトマップの構成は変わりましたが、取り込まれ具合は今までと変わっていません。はてなブログはGoogleからのアクセスをちゃんと受け止めきれないみたいです。
こればっかりは、はてな側が問題を解決してくれないとどうにもならないです。Googleにちゃんとインデックスされないとはてなが損するはずなので、対応したほうがいいと思うんだけどなぁ。

ま、せっかく構成を変えるなら、sitemap_common.xmlの中に/archive/categoryのURLも置いてくれればよかったのに。中途半端だな。残念。

サイトマップ関係の追加の作業

サイトマップが取り込まれないのが納得いかないので、いろいろと試行錯誤してみました。悪あがきです。

sitemap_index.xmlを登録するのが正式っぽいという話です

(実際のところは、sitemap.xmlとsitemap_index.xmlは同じものなので、見違える変化は得られません。)結果が同じだとしても正しいことをするのが正しいです。
kanaxx.hatenablog.jp

複数のsitemapをサチコに直接登録してしまおうという話です

サイトマップインデックスファイルを登録するだけでいいはずなのに、個別にバラバラに登録するといいことがあるかな?の確認作業です。 kanaxx.hatenablog.jp

上の作業が面倒なので、sitemap登録作業を自動化してしまおうという話です

サイトマップを個別に登録するのをAPIを使って自動的に済ませました。すごく楽になりました。 kanaxx.hatenablog.jp

これで、オールグリーンも夢じゃない f:id:kanaxx43:20200708195453p:plain

最後に

今日はここまでです。
サイトマップが取り込まれなくてイライラしているひとに参考になるといいなぁ。

参考にした資料

サイトマッププロトコル
https://www.sitemaps.org/ja/protocol.html