Webサービスの重複コンテンツ対策

ウェブサービス

Webサービスの重複コンテンツ対策について書いてみたい。Webサービスとは、エンドユーザーがコンテンツを生成していくタイプのネットサービスのことを想定している。例えば、

ブログサービス
掲示板
ネットショップ構築サービス

などが考えられる。

Webサービスとはいっても、すでにたくさんのユーザーを抱える規模が成立したサイトは考慮していない、利用者の乏しい現時点で弱いWebサービス開発者と管理者の方向けの対策を考えてみたい。

弱いWebサービスはページ内の重複部分による悪影響を受けやすい

自分でブログを書く場合は、コンテンツの質を制御できる。つまり、書いて載せる内容をブログの著者が100%管理できる。しかし、WebサービスやCGM(Consumer Generated Media)の場合は、不特定多数のユーザーが書き込みやブログ記事・商品登録などを行うため、管理者側で質の制御を意図的に行う必要が発生する場合がある。

特に、規模の小さいWebサービスでは質の制御は必須と考えて良い。すでに規模のあるWebサービスでは、例えば、あるユーザーがコピーしたコンテンツを複数掲載しても影響は軽微かもしれない。が、小さい(弱い)Webサービスの場合には、重複コンテンツを放置しておくと多大なマイナスの影響を被る可能性が非常に高いと考えている。

マイナスの影響とは、Web検索の順位において悪い影響が出るという意味です。影響があるのは、重複コンテンツだけではなく、

titleタグの部分重複
フッターやサイドバーの部分重複

も私は含めて考えているし、その点を含めて考慮されることをおすすめしたい。

SEO専門家の異なる見解

サイト内における重複は低品質とは扱われず、評価がスルーされるというSEO専門家としての見解があるようだが、webサービスの規模によってその見解は変わってくるというのが正しい見方と判断している。

分かりやすく言うと、

規模の大きなwebサービスであれば、上であげたサイト内の部分重複は問題になることはないが、規模の小さな弱いwebサービスの場合には、サイト内の部分重複が問題になることが大いにある

ということ。

規模の無いwebサービスの管理者でここ数か月でweb検索からのアクセス数が落ちたという方がいたら、サイト内の重複について再度確認することを推奨したい。

具体的な対応方法

ユーザーが生成した重複コンテンツに対する具体的な対応方法は、最も簡単なのはコンテンツを削除して404エラーを返すようにするのがシンプルな対応だと考えている。この方法はサイト管理者の裁量で判断できる部分だが、削除されるユーザーのことを考えるとあまり良い対応方法ではない。ユーザーから明確な悪意が感じられず、重複ページが複数生成された場合には、noindexメタタグが有効となる。

noindexメタタグを追加することで、web検索のインデックスから消すことができ、かつweb検索において低品質という評価を受けることを回避することができる(できる可能性がある)。

<meta content="noindex,follow" name="robots" />

具体的には上のコードをheadタグの先頭に追加する。

webサービスを運営していると、中には悪意をもって重複ページや極端にテキストの少ないページ、またはリンクだけのページを生成するユーザーが存在する。そういう場合にもnoindexは利用できる。リンクだけのページを掲載されてしまった場合には、

<meta content="noindex,nofollow" name="robots" />

とすれば、そのページのリンクを検索エンジンのbotが無視してくれるようになる。

noindexメタタグは、webサービスの重複コンテンツ対策に有効というか必須かなと思う。

Webエンジニアブログにコメント

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

Webサービスの重複コンテンツ対策の記事にコメントを投稿