vol.602
東証のシステム障害について
原因が判明しましたね。
東京証券取引所は5日、
1日に起きたシステム障害
の原因を公表した。
相場情報を伝えるシステムを
支える一部装置のメモリーが
故障した際に、
予備のディスクに自動で
切り替える設定に
なっていなかった
という。
システムを担当する
富士通の時田隆仁社長は5日、
「多くの皆様に多大なる
ご迷惑をおかけしたことを
心よりおわびする」と陳謝した。
(日経新聞より)
自動で切り替える設定に
なってなかった?!
なんじゃそりゃ。
東証は
「予備のディスクに切り替わる
テストはやっているが、
メモリーが実際に壊れた形の
テストまで実施するのは難しい」と説明。
そのうえで
「なぜこの事象が事前のテストで
確認できなかったのか、検証していく」
と述べた。
(日経新聞より)
確かに、大規模な
システムになればなるほど
いろんな要因が絡むから、
より本番に近い状態で
テストするのは
難しくなります。
例えば350台もの
サーバが連携する状態で
それぞれのメモリが
故障した場合を想定した
テストをするなら、
少なくとも350回
テストすることになります。
そしてそれが1台とは限らない、
組み合わせも様々、
って言いだしたらキリがないし
どこかで区切りを
つけるしかない。
でも今回の場合、
障害発生後に富士通で
いろいろ調査した結果が
予備ディスクへの切り替え設定
になっていなかったから。
これは完全に納品前の
確認漏れだから、
言っちゃ悪いけど
人災
やね。
大きなシステムは
設定も膨大やから
大変なのはわかる。
でも設定がそうなってなかった
ということは、
人がやること
やってなかったということ。
メモリの故障は
人の手では止められないけど、
設定は人が手でやるもの。
うわー怖!
私が担当者やったら
もう二度と会社行きたくないな。
でも、これで半沢直樹バリに
担当者や責任者を
左遷するだけで
終わらせるようでは
富士通も落ちたもんです。
人間、失敗は誰にでもある。
ここから何に手を付けるかが、
富士通の腕の見せ所。
あ、これまでの何回かの
システム障害も富士通?
自浄能力がない組織は
何度も同じことを繰り返します。
まさに「人のせい」にしてしまうと
本当の原因がわかりません。
今回でいえば、
設定をしてなかったなら
そのチェックは誰が
どうやっていたのか。
〇〇さんのせい、ではなく、
一定レベルの人なら
だれがやってもクリアできる
手順書や指示書、
チェックリストはあったのか。
複数人での確認をしたのか、
など、個人のミスを仕組みで
カバーすることを考えるべきですね。
責任者をクビにして終わり、
とかになりませんように。
中小製造業専門のIT参謀 村上 郁 (むらかみ かおる) |
|
支援内容 |
ランディングページの制作支援 ITシステムの構築・運用のサポート |
---|---|
活動拠点 | 奈良県生駒市 |
営業時間 | 平日9時~18時 |
定休日 | 土日祝 |