リンク
抜粋・メモ
- Kairux: 提案手法
- 普通のroot cause analysisはfailureからbackwardで探すが,Kairuxはプログラムの実行開始からforwardで探す
- プログラム実行を単純な命令列とみなした場合,root causeは異常系の命令列の中で正常系の命令列から外れた最初の命令といえる
- 外れた点をInflection Pointと呼び,Inflection Pointがroot causeであるはずという仮設をInflection Point Hypothesisと呼ぶ
- 10個のランダムな実世界バグ(Hadoop, HBase, Zookeeper)に適用し,7個のroot causeを正確に特定した (data raceのような難しいバグも含む)
Tagged: #root cause analysis