2012年7月2日月曜日

Amazon EC2が落雷で障害

Amazon EC2が落雷で障害 InstagramやPinterestがダウン(ITmedia

2012年6月29日にAmazon EC2にて、大規模な電源障害が発生しました。

上記記事では、Instagram、Pinterest、Netflix、Herokuなどのサービスが数時間にわたってダウンしたと報じられています。

実は、弊社サービスもHeroku上で提供しているため、この障害に巻き込まれました。

ここ最近、クラウド・サービス(PaaS)の大規模障害がニュースになることが多くなっています。
日本では、さくらインターネットやファーストサーバの件が記憶に新しいところでしょう。

クラウド(PaaS)では、自らサーバなどのインフラを所有しないために、コストを抑えることができ、また、契約後すぐに利用できるため、短い期間でサービスを提供することができます。メンテナンスも基本的にフリーですし、スケールアウトするのも、簡単です。これらの要因から、サービスの利用が拡大しています。

記事になっているサービスだけでも、最近爆発的にユーザを増やしているサービスであることが分かります。これらのサービスでは、需要予測もままならない状況ながら、短期間にスケールアウト出来ているのは、こうしたサービスのお陰だと言ってもいいでしょう。

しかし、今回のケースでは、Amazonのデータセンタがいかれたために、こうした多くの人気サービスが立ちいかなくなりました。
元のデータセンタが同じなので、一瞬で、このようになってしまうわけです。

今回は、幸いにも電源障害ということで、顧客のデータなどはほとんど損傷がなかったようです。(当社サービスでも、データ損傷やその他の損失はありませんでした)

しかしながら、今後はサービスの提供もB2Bへ波及し、今まで外に置くことをしなかった企業内のデータであっても、『オンプレミスをクラウドへ』という流れの中で、大きくなることが予想できます。実際に、ファーストサーバの件では、企業のグループウェアのサービスも提供されていて、甚大な被害がおこりました。

少なくとも“クラウド”は魔法の箱ではないということです。
自社にとって大切なデータの保全は、バックアップなどの運用体制をきちんと定め、任せきり(放りっぱなし)にならないよう、もう一度確認しておくことが大切です。