プロジェクト・マネジメントのPMコンセプツ/コラム詳細

プロジェクト・マネジメントのPMコンセプツ/コラム詳細

PMコンセプツ・トップページ >> コラム詳細

採用情報サイトマッププライバシーポリシーお問い合わせ

コラム詳細

2021/04/01掲載
リスク・コミュニケーション
昔、自動販売機を利用した際に、お釣りの硬貨が出てこないトラブルに遭遇し、ガッカリした記憶があります。それとスケールは違いますが、「銀行のATMでキャッシュカードや預金通帳が吸い込まれたまま戻ってこない」という障害が、みずほ銀行で起きてしまいました。みずほ銀行は過去に大きなシステムトラブルを経験しましたが、2019年、ついに悲願となる勘定系システムの完全統合と再構築を成功させました。しかし、情報システムは稼働した瞬間に陳腐化が始まるものです。システムの運用・保守には開発とは違った、リスクマネジメントが求められます。今回のトラブルで感じたのは、事後対応(リスクコミュニケーション)の成否がダメージの大きさを左右するということです。

1つ目に、なぜデータ処理が集中する月末にわざわざ臨時の作業を実施したのか。役員の説明では、「想定が甘かった」とのことですが、なぜ甘かったのか、whyの掘り下げが足りません。2つ目に、なぜ定期預金のシステム障害がATMやインターネットバンキングの不具合につながったのか。役員の説明では、「異常がシステム全体に悪影響を及ぼさないように自衛機能が働いた結果」だとか。しかし、もともと、みずほのシステムはSOA(サービス指向アーキテクチャー)を採用し、サブシステム間を疎結合にして耐障害性を高めたはずではなかったのか。それがなぜ段階的に制御できなかったのか、素人にも分かるように説明するべきでした。

第3に、預金通帳やキャッシュカードがATMに取り込まれ、店内で長時間足止めされた利用客が多数いたにもかかわらず、コールセンターの増員や出勤の指示までに3時間以上も要したことに対する言及の軽さ。単にお金を下ろせないだけなら他行やコンビニに行けば済む話ですが、カードが戻らなければ客はその場を離れるわけにもいかず途方に暮れてしまいます。ATMの前で4時間も待たされることがいかに苦痛か!そうしたことまで含めて派生リスクを想像し、トップと現場で情報、問題点、対策を共有しておかないと、組織的な対応などできるわけがありません。

現場のエンジニアは必死で復旧作業に励んだことでしょう。であればこそ、障害発生の理由と対策について、経営陣が対外的に分かりやすく説明するコミュニケーション能力が問われます。そうでないと現場が報われません。(蹴人)

採用情報サイトマッププライバシーポリシーお問い合わせ