富士通館林システムセンターの電源装置故障はUPSの切替動作障害


この記事は2012年7月に掲載されたものです。
状況が変わったり、リンク先が変わっている可能性があります。

6月7日に発生した富士通館林システムセンターの電源装置故障について、『日経コンピュータ』7月5日号が「ホットニュース」欄で速報した。

 6月7日の早朝から十数時間にわたって複数の銀行や事業会社で発生したシステム障害が、いずれも富士通のデータセンター「館林システムセンター」で起きた電源設備故障に起因していたことが分かった。同センターでは6月7日午前5時57分に、無停電電源装置(UPS)が1台故障。障害回避策が機能せず、同センターの7%に相当する範囲で電力の供給が絶たれた。この影響で、同センターを利用する東京スター銀行の全てのATM、サークルKサンクス子会社でりそな銀行などとATMを共同運用するゼロネットワークスの一部ATMが午後9時まで停止した。また、ソニー銀行の全システムが同日午後1時まで停止した。ニフティのクラウドサービス「ニフティクラウド」の管理ポータルや一部の顧客用サーバーもダウンしたため、同サービスを利用するスクウェア・エニックスのオンラインゲームなども終日停止した。

続いて、被害を受けたソニー銀行が障害の詳細を7月10日発表した。原因について、次のように述べている。

  • (1)この度のシステム障害の直接的な原因は、データセンターにおいて、電源設備の一部であるUPS(無停電電源)装置に障害が発生し、多重化構成をとっていたにもかかわらず正しく切り替え動作も働かなかったことによるものです。
    電力供給は同日の午前5:59から午前7:43まで途絶いたしました。その後、サービスは順次回復しましたが、引き続きソニー銀行のサービスがご利用いただけない時間帯が発生いたしました。
  • (2)電力供給は同日の午前7:43に回復しましたが、その後のサービスの全面復旧に約5時間を要しました。これは、多数のシステムの起動において、二次的な障害を避けるため安全確実に回復させることを最優先したことによるものです。

つまり、停電などではなく、停電に備えるために設置していたUPS自体に障害が発生し、冗長化していた別のUPSに切り替わらなかったというものだ。冗談のような顛末だが、実はファシリティの現場でこうした障害は少なくない。無停電電源装置であるはずのUPSを入れたばかりに、逆に長時間停電になってしまうケースもあり、なんのためのUPSかわからなくなる。富士通が誇る館林システムセンターも結局同じだったわけで、データセンターが安全とは決して言い切れないということだ。

電源自体は7時43分に復旧しているので、データセンター側の障害は1時間44分ということになる。もちろん、サーバがいきなり落ちたのだから、そこからデータ消失などがないか確認しながらサービス再開するのには時間がかかる。ソニー銀行の約5時間は迅速な部類に入るのではないだろうか。

こうした原因の詳細は、本来なら富士通自身がリリースすべきことだろう。情報公開しない富士通に比べ、原因と対応をきちんと発表したソニー銀行。さすが、日経金融機関ランキングで顧客満足度第1位を5年連続キープしているだけのことはある。

(2012年7月23日追記)

『日経コンピュータ』7月19日号が「動かないコンピュータ」欄で詳細を報じた。