Google は HTML フォーム経由でしかたどれないページにも探索の網を広げるつもりらしい。11日の Webmaster Central Blog によるとここ数ヶ月、Googlebot はウェブページに含まれるフォームにいくつかクエリを送って、インデックスに追加できるページの URL を得られないか試してみるというようなことをしていたそうだ。
GET フォームだけが対象だそうだから、POST で送るフォームは対象にはならない。このブログにもついているようなサーチボックスなんかを対象として想定していると思われます。今までみたいに明示的にリンクが張られている URL だけをクロールしていたのでは見つけられなかった URL も今後はインデックスしていきますよ、ということなのかな。
ところで、僕が公開している Contact Form 7 という WordPress 用コンタクトフォームプラグインがありまして、そいつはフォームに入力された内容を Ajax で POST するんですが、その時の送信先の URL (それ専用にクエリを追加したもの)が Google にインデックスされてしまい、SEO 的に問題があると多数のユーザからクレームをもらったことがありました。今年の1月頃の話です(最新版では対処済み)。
そのときは Google がなぜフォーム(しかも POST)の送信先をインデックスしているのかさっぱりわからず、なんで僕が怒られんといかんのかと、不可解な気持ちがしていたのですが、どうやら今回のこれが原因だったんではないかな。たぶん Google は当初 GET も POST もお構いなしに実験をしていて、僕にクレームしてきたユーザのサイトはたまたまその実験に巻き込まれてしまっていたんじゃないか、と思ってみたりしますが真相はいまも謎。
情報元:
