キーワード出現率が高すぎるページがGoogleにインデックスされている

完全にスパムと判断できるがSEO的に高く評価されているようで迷惑を被っています

キーワード出現率がどのくらい高いのかチェック

スパムサイトにWebエンジニアブログのテンプレートでキーワード出現率が高すぎるページを多数公開されています。

本ブログと同じテンプレートで、文章としてキーワード出現率・密度の高い、いわゆるキーワード詰め込みスパムのページを多数公開され被害を受けています。

どのようなページか画面キャプチャを載せてみます。

keyword-density1

当初はcssが適用されたページだったのですが、cssの参照先を本ブログに直リンクする方法で取得していたため、リファラをチェックすることで、外部サイトから当サイトの静的コンテンツを直接取得できないようにしました。

そのため、上の画像はスタイルが適用されない状態になっていますが、テンプレートはWebエンジニアブログのHTMLを一部変更して流用しているようです。

リファラチェックをすることで、cssファイルへのダイレクトなアクセスに対して403エラーを返すようにしましたが、リクエストが多数発生しており、迷惑を被っている状態です。

キーワードの密度頻度も高いページだがGoogleにインデックスされている

上のようなキーワードを詰め込んだページが一つ二つではなく、多数インデックスされているようです。また、検索エンジン経由かの判断はできませんが、アクセスがあるようで、その度に当サイトのCSSファイルに対するアクセスログが残る状態です。

上の画像のページのURLでGoogle検索したのが下の画像です。

keyword-prominence1

キーワード出現率が高すぎるページでも問題なくインデックスされています。

  • ページ数
  • 公開サイト数

双方ともに増加しているようなので、このままインデックスが削除されず、検索経由からのスパムサイトへのアクセスが増え続けると、cssファイルに対するHTTPリクエストが増え続け、大きな被害になる可能性があります。

siteコマンドを実行しインデックス数を確認

以下のサイトコマンドで当サイトのテンプレートでどのくらいスパムページが公開されているのか確認してみました。

site:www.xxxxxxxx.xxx/balenciaga

実行した画面キャプチャは以下のとおり

keyword-proximity1

上のサイトの場合は、

269件

もキーワード詰め込みスパムのページがインデックスされていました。

全部のページを見たわけではありませんが、おそらく上の階層のページはすべて

キーワード出現率・密度・頻度の高いスパム

と思われます。

スパムページを公開している他のサイト

キーワード出現率が高いページを当サイトのテンプレートで公開しているサイトは他にも多数あります。

ページ本体

keyword-density2

インデックス状況

keyword-prominence2

siteコマンド実行

keyword-proximity2

なんと

676件

もインデックスされています。

キーワード出現率が高いページを公開しているサイトはなんなのか?

なぜ、当ブログのテンプレートを流用してキーワード詰め込みコンテンツを多数公開しているサイトが発生したのだろうか?

現時点では、

なんらかのハッキングを受けたサイトで上のようなページが公開されている

と考えている。

そのため、サイト名やURLを伏せた状態にして、画面キャプチャを載せることにした。

現時点で、公開しているサイトの数は多数存在するが、近日中に複数のサイトに連絡を取り、意図してページを公開しているのか確認してみる予定。

全てではないが、Googleへのスパム報告は行った。

今後も数が増えると、DDOS攻撃と同じようなサービス妨害攻撃となる可能性がある。進展があったら再度ブログ記事にする予定です。

キーワード密度は5%が最適はウソ

残念ながら、そう判断せざるを得ない事例に遭遇してしまった。

キーワード出現率・密度は5%が最適

ウソもしくはSEOのネタ

と判断できる。

だからといって、キーワードの全体に対する比率を上げたコンテンツを作成するのがおすすめだとは考えていないし、実際におすすめする気もない。

SEOの酷い実例については今後も記事していこうと考えている。