メガバンクの大いなる失敗に学ぶ一冊

著者:日経コンピュータ
出版:日経BP
出版年月日:2022/3/17

本書は、日本の金融業界を代表するメガバンクの1つ、みずほ銀行が引き起こしたシステム障害の事後レポートである。レポートの対象は、2021年2月からの1年間で11回も発生したシステム障害だ。本書によると、みずほ銀行では2002年と2011年にも大規模システム障害を引き起こし、その失敗を二度と繰り返さないことを目的に2019年までに勘定系システム(*1)の刷新を終えていた。ところが、障害は繰り返され経営トップの引責辞任へとつながっている。

本書では、以下の章立てを通じ、そうした失敗(システム障害)がなぜ繰り返されたのかを解き明かし、みずほ銀行のような事態に陥らないために何が必要とされるかを示唆している。

  • 第1章 前代未聞 12カ月で11回のシステム障害
  • 第2章 行内で何が起きたのか システム障害の真相
  • 第3章 なぜ障害は拡大した 15個の疑問点
  • 第4章 金融庁が分析する「原因」「背景」「真因」
  • 第5章 障害を繰り返すみずほ銀行のシステム その歴史を紐解く
  • 第6章 なぜみずほ銀行でだけ、何度も障害が起きるのか
  • 第7章 みずほ銀行は立ち直れるのか

*1) 勘定系システムとは、預金・融資・送金・為替など、銀行の会計勘定処理を実行するシステムのこと。勘定系システムは、銀行の中核業務を担う仕組みであり、それが停止すると全銀行業務が停止し、ATMや銀行支店の窓口業務、インターネットバンキングなどすべてが使えなくなる。

「あってはらないこと」「ありえないこと」が起きた謎を解き明かす

金融業界は装置産業とされITで作られたシステムが、ビジネスを支えている。なかでも勘定系システムは銀行にとって最重要のビジネス基盤だ。と同時に、世の中の金流を支える社会基盤でもあり、生活者のライフラインでもある。ゆえに常時の安定稼働が求められ、障害による停止はあってはならず、障害の長期化や頻発によって多大な負の影響を社会全体に与えることになる。

そのため、日本のメガバンクはすべてが相当額の費用を投じて勘定系システムの開発・運用管理を行い、日本を代表するIT企業がそれをサポートしてきた。実際、みずほ銀行が2019年に完成させた勘定系システム(「MINORI」と呼ばれる)にしても、開発に4,000億円強の巨費が投じられ、その開発には富士通、日本IBM、日立製作所、NTTデータなど、国内屈指のIT企業が名を連ねている。加えて言えば、メガバンクは、みずほ銀行と同様に複数の大手銀行の合併によって誕生しており、一様に大がかりなシステム統合を経験している。言い換えれば、どのメガバンクも技術的な条件はほぼ同一であり、みずほ銀行だけが勘定系システムの障害を頻発させるというのはまさに「ありえないこと」だった。

本書では、その「ありえないこと」がなぜ起きたのかを、ほぼ全編にわたって(第3章〜第7章にわたり)システムと組織の両面から詳細に記述している。著者が、歴史ある企業ITの専門メディア「日経コンピュータ」であるだけに、システム障害の原因や、なぜ障害が拡大したかについての記述は非常に詳しく、かつ明快である。2021年の障害を引き起こした「MINORI」について、障害の主因とされる「データベースの更新不能」がなぜ起きたのかをはじめ、「障害原因の見誤り」「システムの警告・エラーの見逃し」「経営トップへの連絡の不徹底」「致命傷につながった不手際」「ハードウェア障害の頻発」など、障害を拡大させた事象の原因が丁寧(ていねい)に説明されている。

また、本書によると、MINORIでは2002年と2011年に起きた旧システムの障害を繰り返さない目的でSOA(サービス指向アーキテクチャ)では新たに採用され、勘定系システムをいくつかの部品(コンポーネント)に分割したうえで、それぞれを「疎結合」のかたちでつなぎ合わせ、各コンポーネントをサービスとして他のコンポーネントから利用できる構造になっているという。こうした構造は、1つのコンポーネントの機能変更や障害が全体に与える影響を小さく抑えられるがゆえに、システムを構成する機能が「密結合」のかたちでつながっているモノシリック(一枚岩的)なシステムに比べて、柔軟性と拡張性、そして耐障害性に優れているとされる。本書では、それでもMINORIが障害を拡大させてしまった理由についても、しっかりと分析している。

さらに、前述した章立てからもわかるとおり、本書(の第5章・第6章)では障害を繰り返すみずほ銀行のシステムの歴史を詳細に振り返りながら、「なぜみずほ銀行でだけ、何度も障害が起きるのか」について解き明かしている。そのストーリーは純粋な読み物としても面白く、長きにわたって企業ITを取材し、システム障害を扱った人気コラム「動かないコンピュータ」を連載してきた日経コンピュータならではの記述といえる。

みずほ銀行の成り立ち:1999年に第一勧業銀行と富士銀行、日本興業銀行の3行によってみずほホールディングスが設立され、2002年にみずほホールディングス傘下であった第一勧業銀行・富士銀行・日本興業銀行の分割・合併により、旧みずほ銀行とみずほコーポレート銀行が誕生した。のちの2013年に、みずほ銀行とみずほコーポレート銀行が合併し、現在のみずほ銀行が生まれている。

度重なるシステム障害に学ぶべき教訓

本書のタイトルや上の記述からも察せられるとおり、本書のメインターゲットは、日経コンピュータと同じく企業システムの開発・運用管理にかかわる担当者やマネージャー、経営幹部であり、企業ITに関して一定の知識がないと読みこなすのは難しいかもしれない。とはいえ、本書では勘定系システムの構造について可能な限りわかりやすく説明しようとする配慮が随所に見られるほか、そもそも勘定系システムを含めて、企業システムの構造自体は極端に難解なものではない。ゆえに、企業ITに関してそれほど深い知識がなくとも、MINORIを含むみずほ銀行の歴代の勘定系システムが、どのような障害を発生させ、その原因がどこにあったのか、あるいは、なぜ障害の連鎖が発生したかの技術的な詳細も理解できるのではないだろうか。

加えて言えば、本書から学ぶべきより重要なポイントは、障害を発生させたシステムの構造や技術の問題ではなく、人と組織、組織文化の問題であるように思える。

実際、本書を読み進めていくと、みずほ銀行の度重なるシステム障害の原因の多くが、人と組織、組織文化の問題に起因していることがわかる。例えば、MINORIにしても(システム構造上の問題は多少あったようだが)人と組織が正しく機能していたならば、1年で11回もの障害を引き起こすようなこと起こらなかったと本書では結論づけている。そのため、本書ではMINORIの仕組みとしてのあり方や方向性については否定しておらず、むしろ、肯定的だ。

では、システム障害を頻発させたみずほ銀行における人と組織、そして組織文化の問題とは何だったのか──。その詳しくは本書をお読みいただきたい。それによって、おそらくはシステムの継続性を高めるために組織としてどのような活動を展開すべきかをはじめ、システムの開発チームと運用チームがフラットな関係の中で一体になって動くことの重要性や組織全体でビジョン・目的を共有し、チーム内外の信頼関係を維持・強化することの大切さ、さらには「心理的安全性」を確保し、失敗から多く学ぶ文化を醸成していくことの重要性が改めて認識できるはずである。その意味で本書は、企業ITに携わっているいないにかかわらず、組織のリーダーにとって有益な「失敗のリスクを低減させるための教材」となりうるのではないだろうか。