年末に生じたDNS障害と当サイトにおいて断続的に発生したDNSエラーを調査
Twitter検索により障害規模の違いが明確になった
VALUE DOMAIN(GMOデジロック)という企業のDNSサーバを利用してブログを運営しているのですが、
断続的なDNSエラーが生じている時期があり、アクセス数にも少なからず影響を及ぼしていました。
Googleウェブマスターツールのクロールエラーの画像を再度載せてみます。
2014年7月1日から2014年10月10日までの期間に、継続的に10%ほどのDNSエラーが発生していることが確認できます。
記事を公開したところ、同じトラブルを抱える2名の方からコメントを頂くことが出来ました。
このトラブルの対応としては、
VALUE DOMAINの管理画面 → ネームサーバー変更
で
- NS3.VALUE-DOMAIN.COM
- NS4.VALUE-DOMAIN.COM
- NS5.VALUE-DOMAIN.COM
を追加することで、様子を見ている状態になっている。
この件についてVALUE DOMAINのサポートに確認したところ、
ネームサーバーの混雑が原因の可能性がある
といった案内を受けた。また、オフィシャルな障害発生告知は行われていない。
DNS障害が発生
2014年末にVALUE DOMAINのDNSサーバに障害が発生しました。この障害は規模が大きめ(影響を受けるユーザーが広範囲)だったようで、TwitterでホールディングカンパニーであるGMOインターネットが告知を行っている。
https://twitter.com/GMOGroup/status/546911761568264193
この障害により、本ブログにおいても午後2時くらいから2時間ほどアクセスが激減するといった影響があった。また、この時期のクロールエラーは画像のように記録されている。
googlebot訪問のタイミングを考慮する必要がありますが、円で囲った長期間に渡るDNSエラーよりも軽微なエラーが年末のDNS障害により、DNSエラーとして記録されました。
Twitter検索をしてみた
同じDNS障害にも関わらず対応に明確な差がある点に違和感を感じたのだが、障害の被害を訴えるツイートを検索することにより、さらに違和感が増大した。
年末のDNS障害
最初に2014年末のDNS障害をTwitterで検索した。
valuedomain dns 障害 since:2014-12-15 until:2014-12-31
期間はやや多めではあるが、2014年12月下半期としました。
Twitterを検索した結果からDNS障害により影響を受けるユーザーの規模が大規模なものであると判断できます。
DNSエラー検知期間
一方、3ヵ月以上に渡りDNSエラーが当ブログで発生していたわけだが、その期間のTwitter検索がどのようなものであったのか確認してみました。
valuedomain dns 障害 since:2014-07-01 until:2014-10-10
同じ検索キーワードで期間指定をDNSエラーが発生した時期に調整して検索してみた。その結果、
- ツイートの件数1件
- DNS障害のツイート数0件
という事実が明確になった。
この結果から、本ブログにおいて生じたDNSエラー検知期間において、同様の影響を受けたユーザーはごく小規模に限られていることが分かった。
ただし、最初のレポートに同様のDNSエラーに遭遇している2名の方からコメントを頂いた点を補足しておかないといけない。
Twitter検索において、
「クロールエラーとしてDNSエラーが上がってきた」
というツイートをしたユーザーは皆無であったが、アクセス数が一日あたり数百の本ブログのDNSエラーについてのレポート記事には、同じ被害に悩む2件のコメントがついた。
私を含めて3名のVALUE DOMAINユーザーというごく限られた範囲に対して、ネームサーバーの混雑が原因でDNSエラーを長期間検知し続けるといった非公式な障害が発生したことになる。
局所的かつ断続的な障害が発生するものなのだろうか?
なにかおかしくないか?
小規模な数名のユーザーのみが継続的にDNSエラーでブログを閲覧できない状態になることがあったという特異な事例であるため、引き続きVALUE DOMAINのDNSサーバを利用しつつ様子見を続けたいと思います。