このブログはにほんブログ村というブログのランキングサイトに登録しているのだが、今日アップした記事が新着記事に反映されていない。私が読んでいる他のブログでも同じことが書いてあったので、私だけではないようだ。このブログ村というのはちょくちょくトラブルを起こしており、前も同じようなことがあって、問い合わせフォームから運営に文句を言ったらようやく対応してくれた、ということがあった。今回もブログ村は何かを「カイゼン」したらしいのだが、カイゼンになっていない。
他の人はどうだろうと思って、同じカテゴリのブログを片っ端から見ていったら、最新の今日の記事が反映されている人もいれば、反映されていない人もいる。どういうことだろうと思ってよく見たら、反映されていない人は皆独自ドメインでWordPressでブログを書いている人ばかりだった。
どういうことじゃい、と思って自分のサーバにSSHでログインし、Webサーバのログを調べてみた。記事を更新したらブログ村のサーバにpingという更新通知が飛び、それを受けたブログ村のサーバからblogmuraBotというクローラが来て/feedというファイルをまず読んでいき、その内容(XML)を解析して、次に新規追加された記事の内容を取得しに来る、という二段構えになっている。
昨日の場合だと、
$ zgrep blogmuraBot access_log.20201112.gz 13.230.151.47 - - [11/Nov/2020:05:00:55 +0900] "GET /blog/hammer/feed HTTP/1.1" 304 0 "-" "blogmuraBot/2.0 (+https://blogmura.com)" "-" 13.230.151.47 - - [11/Nov/2020:17:30:41 +0900] "GET /blog/hammer/feed HTTP/1.1" 200 76464 "-" "blogmuraBot/2.0 (+https://blogmura.com)" "-" 13.230.151.47 - - [11/Nov/2020:17:30:46 +0900] "GET /blog/hammer/archives/2020/11/11-17-30-40-17280.html HTTP/1.1" 200 15751 "-" "blogmuraBot/2.0 (+https://blogmura.com)" "-"
という結果になっている。05:00:55にbotが来ているがこれはおそらく定期クロールでステータスコードは304(Not Modified)なので何もしていない。記事をアップしたのは17:30:40なのだが、その1秒後、17:30:41にblogmuraBotが来て/feedを読んでいき、その5秒後に再びアクセスがあって、個別記事のURLにアクセスしている。これでブログ村に最新記事が反映される。
しかし、今日のログでは、
$ grep blogmuraBot access_log 13.230.151.47 - - [12/Nov/2020:05:01:26 +0900] "GET /blog/hammer/feed HTTP/1.1" 304 0 "-" "blogmuraBot/2.0 (+https://blogmura.com)" "-"
05:10:26のアクセスのみ。これは前日と同じく定期クロール。実際には18:28:47に記事をアップしているのだが、それをクロールしにきた形跡はない。
というところまで調べて、またしても運営に「なんでじゃい!」と送ってみた。なんかこのサイト、大丈夫なのかなあ。まあブログ村経由でこのブログを読んでくださっているのはほんの数人みたいなのだが、弱小ブログなのでその数人の目に触れなくなるのもちょっとなあ、という感じ。
毎日5時頃に定期クロールが来てるみたいなので、最悪5時になれば昨日の分は反映されるのだろうか。これでカイゼンされなければ諦めよう。