検索結果上位表示プロジェクトでは、オープンソースのCMS(コンテンツマネージメントシステム – ブログのように投稿でホームページができあがるシステム)を敢えて使用している。
単に上位表示を目指すならホームページの記述言語、HTMLで作成した方が効率的である。理由は、CMSでは、検索エンジンとの親和性を高める処置が取りにくいからである。取れたとしても、必ずしも最善でなかったりする。しかし、現在の顧客のニーズは、サイト完成後に自社内で変更ができる事であり、CMSに対する期待は大きい。(弊社の経験では、残念ながら、自社更新が完全にできるお客さんはいなかった。自社でできるなら、そもそも、制作会社に依頼する事もない。)
ブログが検索されると、内容が同じでURL(アドレス)が違うページがある事をご存じだろう。特に、掲載数の少ないキーワードでは、検索結果に同じ内容のブログが数件掲載されていることがある。これは、CMSがカテゴリやタグ、サイト内検索などで表示される同じ内容のページを別々のURLで表示するからである。
一方、検索エンジンをだます為に、内容をコピーしたサイトから被リンクを受けてサイトの重要性を稼ごうとする動きがあり、Googleは重複コンテンツに対して評価を下げる対応をしている。また、検索エンジンの利用者からすれば、重複したコンテンツは、少ない方が早く本当に欲しい結果に行き当たるので、検索エンジン側の重複コンテンツに対する対応は正当化される。
これを受けて、弊社では、検索エンジンの探査(ロボット)に対して、ブログなどで重複ページを見に行かせないように対応している。しかし、ページ上のリンクでは、重複コンテンツをたどることができる為、検索エンジン側の索引作成効率化には寄与していないに違いない。
そこで、どれが元になるページか表すcanoicalタグが導入された。CMSのなかには、このタグを生成できるものや、後からプラグインやモジュールなどと呼ばれる追加プログラムによって、対応できるものがある。今回のプロジェクトでもこの対応をおこなった。
もっとも、弊社では、Google側はそれほど、ブログなどでの重複コンテンツに評価を下げる対応をしていないと踏んでいる。多くのプロガーがこの状況を理解していないのに検索エンジン側が対応するのは不適切と考えていると思われる。その証拠に検索結果には重複コンテンツでも、上位に掲載されている。