Googleクローラーが “canonical” をHTTP Headerレベルで対応と発表

Google Webmaster Central Blog(English)で先ほど発表されたようです。

詳細を以下に・・・。

【公式アナウンスページはこちら】
Official Google Webmaster Central Blog: Supporting rel="canonical" HTTP Headers

一部内容を抜粋すると・・・

To see the rel=”canonical” HTTP header in action, let’s look at the scenario of a website offering a whitule paper both as an HTML page and as a downloadable PDF alternative, under these two URLs:
(HTTPヘッダでrel=”canonical”アクションを見るためには、PDFと代替ページとして同一内容のHTMLを提供しているウェブサイトを見てみましょう)

  • http://www.example.com/white-paper.html
  • http://www.example.com/white-paper.pdf

なるほど、要は良く利用されるパターンとしてPDFとそれと同一内容のHTMLページを提供しているようなページを例にあげています。

で、この場合はこんなふうにHTTPヘッダに記載することで、Googlebot(クローラー)に正しいURLを指し示すことが出来るようです。


GET /white-paper.pdf HTTP/1.1
Host: www.example.com
(...rest of HTTP request headers...)
HTTP/1.1 200 OK
Content-Type: application/pdf
Link:<http://www.example.com/white-paper.html>; rel="canonical"
Content-Length: 785710
(... rest response headers...)

PDFファイルにアクセスした場合にrel=”canonical”を使って、HTML側に向けるということですね。(Googleがクローリングしやすい方に向けるってことかな)

このHeaderの利用に関しては、以下のような説明が書かれています。

Another common situation in which rel=”canonical” HTTP headers may help is when a website serves the same file from multiple URLs (for example when using a content distribution network) and the webmaster wishes to signal to Google the preferred URL.
(これ以外のrel=”canonical” HTTP ヘッダーを使うシチュエーションとしては、
ウェブサイトが複数のURLから同じコンテンツを配信するような場合です。
(例えばCDNを使っていたりする時)
その時は、優先すべきURLをウェブマスターはGoogleに教えてください。)

PDFやOffice系のファイルにも適用できそうですねー。
もしくは、CDNと書いてあったので重複コンテンツであれば使っても良さそう。

HTML内での記述以外のサポートということで、色々と使いどころもありそうです。
SEO対策としても、適切な文字列が書かれているHTMLをクローリングしてもらったほうがいいので、良いですねー。


Comments

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です