はじめに
障害分析とは、システムや製品、サービスで発生した障害やその原因を特定して、再発防止策や改善策を見つけるためのプロセスですが、皆さんはどのようなステップで検討していますか?
【障害分析の主なステップ】
①事象の収集:障害発生内容について情報を収集する。
②初期分析:問題が再現できるか、また影響範囲がどの程度あるか検討する。
③原因分析:障害が発生した直接原因、根本原因を特定する。
④再発防止策の策定:原因について再発を防ぐための具体的な対策案を検討する。
⑤対策実施:対策案を実践することで、根本原因が取り除かれていることを検証する。
今回は上記ステップ②について、筆者が良く使う考え方をご紹介したいと思います。
初期分析例
例えばテストで、障害となる事象a1を発見したとします。
次に障害を発生させるための条件(手順)を変えて、事象a1と同じような事象a2を見つけたとします。
【事象a1と事象a2の関係性】
この時、条件および事象を抽象化することで、障害をもう少し簡単(分かりやすく)まとめてみます。
【事象a1と事象a2をまとめる】
ここで、事象Aと類似するような障害があるか(水平展開)や、さらに抽象化(垂直展開)できるかを改めて考えてみます。
何か別の事象(事象B、事象C、・・・)に気付けたでしょうか?実際に障害が発生するのかも試してみてください。
もしかしたら、障害について新たな気付きを得ることが出来るかもしれません。
最後に
これはあくまで、試行することで新たな障害を検知するための方法ですが、障害分析をするついでに別の障害を検知できないか、また探索的テストでの利用についても、是非一度試行(思考)してみてください。