検索エンジンスパムとコメントスパムの間にある類似性を発見

WebエンジニアブログのCSSを直リンクしたキーワード出現率の高いスパムページとコメントスパムを見比べてみた

スパムページのインデックスとコメントスパムを公開

数日ほど前から大量のスパムページを公開され、当ブログの静的コンテンツに対するHTTPリクエストが増加していた。

どのようなスパムページが公開されていたのか興味がある方は

キーワード出現率が高いページがGoogleにインデックスされている

上の記事を見ていただきたい。

Googleへの通報やホスティング会社、サイト管理者への連絡の甲斐あってか、サーバの負荷は収まりつつある。

上に載せたリンクの記事でどのようなキーワード詰め込みコンテンツがGoogleに大量にインデックスされたのか載せてみたが、本エントリーでは、

検索エンジンのインデックス状況
コメントスパム

の双方を公開する。公開することにした理由として、

  • 悪質な事例であること
  • スパムページとコメントスパムに類似性があること

が挙げられる。

コメントスパムについては、以前からスルーしてきたが、今回当サイトのテンプレートを流用した検索エンジンスパムが行われてしまったため、悪質な事例と判断した。

検索エンジンスパムのインデックス

下の画像がインデックス状況になる。

search-result-fade

小さくて見えない場合は、

http://dim5.net/wp-content/uploads/2014/07/search-result-fade.png

上のリンクから標準サイズの画像を閲覧できる。

各インデックスのコンテンツは、

キーワード出現率が高いページがGoogleにインデックスされている

で確認できる。

グッチなどの主要なブランド名を主軸として、その関連語を組み合わせたタイトルで大量にインデックスしている状況が確認できる。

このインデックス状況を踏まえた上でどのようなコメントスパムを受け付けたのか載せてみる。

コメントスパム

7月8日まではすべてのコメントを無条件にデータベースに保存し、その後手動で承認する方法を採用していた。コメントスパムについては、[スパム]に手動で振り分けるようにしていたため、現在もすべてのスパムコメントを管理画面から閲覧可能になっている。

comment-full

下のリンクから標準サイズの画像を閲覧可能。

http://dim5.net/wp-content/uploads/2014/07/comment-full.png

Googleのインデックス状況と合わせて確認してみると、双方に類似性があると判断できるとまでは言えないまでも、

似た属性

の人、組織によるものなのかなと想定できる。

そのため、WordPressのコメント検索機能を使って、[グッチ]のコメントスパムを検索してみた。

comment-spam

下のリンクから標準サイズの画像を閲覧可能。

http://dim5.net/wp-content/uploads/2014/07/gucci-full.png

グッチのコメントスパムが複数確認することができた。そして、コメント欄のユーザー名に、

主要なブランド名 + その関連語

と組み合わせで投稿していることが確認できる。

これらの情報から、これまでに投稿されたコメントスパムと今回発生した検索エンジンスパムの大量発生の間には、類似性が確認できると判断している。

いったいなんのために?

類似性が確認できたため、同一人物、もしくは組織によるものと考えているが、動機については謎である。

コメントスパムについては、不特定多数のブログに行っているものと考えてきたが、今回検索エンジンスパムとして、大量のスパムページがインデックスされ、それらのページからリクエストが発生したことによる、サーバ負荷増大を受け、

ブログの運営を妨害する目的

があるものと考えている。

似たような状況に遭遇しているブログ管理者の方がおられたら、ぜひコメント欄から連絡して頂きたい。

Webエンジニアブログにコメント

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

検索エンジンスパムとコメントスパムの間にある類似性を発見の記事にコメントを投稿