システム障害の原因と予防策 -みずほ銀行2度目のシステム障害から学ぶ教訓-
(以前書いた,みずほ銀行の2度のシステム障害から,経営者やエンジニアに必要なことは何か考察してみたもの.一学生が書いた駄文です.)2002年4月1日,第一勧業銀行,富士銀行,日本興業銀行の三行が経営統合し,みずほ銀行が誕生する.同日,統合後の新システムに障害が生じてATMに関するトラブルが相次ぎ,損害額は18億円にのぼった.恐ろしいことに,障害は一度では終わらない.9年後の2011年3月,みずほ銀行のシステムは再び大規模な障害を引き起こす.3月11日に発生した東日本大震災に伴い,ある二つの義援金口座に全国から振り込みが集中したことが直接的な原因であった.事後処理の最中の作業漏れや操作ミスも重なり,復旧は22日夜までかかった.損害額は80億円にまで及んだ.なぜみずほ銀行はここまで大規模な障害を起こしてしまったか.そして,これを防ぐために経営陣やエンジニアにできることは何だろうか.みずほ銀行の大規模システム障害の根本的な原因は経営陣のITに対する理解不足である.彼らはシステム障害の恐ろしさを理解していなかった.2011年当時,障害直後の指示が遅れたことで対応が後手に回ったこと,情報システム運用の難しさを分かっていなかったためにシステム部門に無理な運用を強いていたこと,二十年以上前に構築したシステムを使用し続けることのリスクから目を背けて老朽化したシステムの刷新を先送りにしたこと,システ
コメント