「動かないコンピュータ」が富士通館林システムセンターのUPS切替動作障害を詳報


この記事は2012年7月に掲載されたものです。
状況が変わったり、リンク先が変わっている可能性があります。

「『動かないコンピュータ』で富士通館林システムセンターの電源装置故障を取り上げてほしい」と書いたが、そのとおりになった。

6月7日に発生した富士通館林システムセンターのUPS切替動作障害について、『日経コンピュータ』7月19日号が「動かないコンピュータ」欄で詳報。「国内DCで大規模障害が続発 『一極集中』のリスクが浮き彫りに」のタイトルで、6月20日に発生したファーストサーバのデータ消失と併せて報じている。

記事によると、障害は館林システムセンターのA棟で発生した。同センターの電源設備は、1系統につき分電盤上流に本番UPS2台と予備UPSが1台あった。さらに予備UPSまで停止した場合に備え、外部電力を直接供給する直送回路まで用意していた。だが、今回は本番UPS1台の故障と同時に、分電盤への電源供給元を切り替える出力分岐盤が正常に機能せず、センター全体の7%の範囲で電力供給が絶たれたという。

故障の原因だが、トリガーとなった本番UPS1台は電流制御機構の素子損傷、出力分岐盤は隙間にたまったホコリによる誤作動だという。A棟は1995年オープンだが、それ以来17年間のホコリが積もったままになっていたという。富士通は出力分岐盤の定期点検を年2回実施していたが、実際に故障を発生させてまでの訓練は難しい。このため、今回の障害が起きるまでホコリの問題に気づかなかったという。富士通では、まず故障したユニットを交換して防塵対策を行ない、2013年3月末までに新機器を導入するという。

編集部が掲載している模式図が正しいとするなら、この出力分岐盤がボトルネックになっていたわけで、この部分も冗長化出来なかったのかと思う。この系統にあったサーバ全体がダウンしたのか、それとも残りの本番UPS1台の配下は助かったのか、そうした詳細も含めて富士通は原因と対策を広く公開すべきだろう。顧客には直接説明しているのだろうが、これからデータセンターを選択しようとしている新規ユーザのためにも、ネットでの公開が必要だと思う。

同誌の木村岳史編集長は奥付の「編集ノート」で、

事業者を弁護するつもりはありませんが、どんな場合でも障害は起こり得ます。メリットがあるなら活用したほうがよく、その際にリスクを勘案してサービスを選び、納得のいく契約を結び、日々のリスクヘッジを怠らないようにすればよいのです。リスクを理由に最新トレンドに背を向けると、必ず後れを取ることになります。

と強調している。この考え方自体は私も賛成だが、だからこそ富士通は自ら情報公開することが重要ではないか。普通なら、障害を経験したベンダーは対策を練るはずで、誠意を持って説明すれば、トラブルを信頼に変えるチャンスにすることも出来るはずだ。そうした姿勢を問いたいのだ。