SRATS2017

用語

一般的な統計用語

AIC

Akaike Information Criterionの略.情報量基準に基づいたモデル選択手法のひとつ.以下の基本公式によって算出される.

AIC = -2 ×(モデルの最大対数尤度)+ 2 ×(モデルの自由パラメータ数)

モデル比較を行う際には,AICが小さいモデルがデータによくフィットしている.AIC は相対的評価基準であり,提示された候補の中で最良のモデルを選ぶ際に用いられる.

BIC

Bayesian Information Criterionの略.情報量基準に基づいたモデル選択手法のひとつ.以下の基本公式によって算出される.

BIC = -2×(モデルの最大対数尤度)+(モデルの自由パラメータ数)× log(データ数)

モデル比較を行う際には,BIC が小さいモデルがデータによくフィットしている.BIC は相対的評価基準であり,提示された候補の中で最良のモデルを選ぶ際に用いられる.

EMアルゴリズム

未観測データを含むデータから最尤推定値を算出する際によく用いられる.アルゴリズムは最急降下法やニュートン法などと同様に解を逐次改良していく繰り返し探索のアルゴリズムになり,収束は遅いが大域的収束性を持つため安定している.

KS Distance, KS 検定

2つの母集団の分布関数の間の差を表す.モデルの適合度を測る尺度の一つ.またそれを用いた適合度検定.

対数尤度関数 (Log-Likelihood Function)

尤度関数の対数をとったもの.データが確率モデルから標本として得られる確率(密度).これを高くするようにパラメータを決定する方法が最尤法と呼ばれる.

二乗誤差(Square Error)

確率モデルを用いて求めた平均と実測値の差の二乗.MSE (Mean Square Error) は例えば複数の時点計算した二乗誤差を平均したもの.

ソフトウェア信頼性における一般的な用語

フォールト(fault)

システム上の欠陥(defact).障害の原因であるが実行するデータが入力されないかぎりエラー・障害を起こさない.

エラー(error)

システムの意図している振る舞いとシステム内部で起きている実際の振る舞いが食い違うこと.

障害(failure)

システムの挙動が仕様から逸脱する状態

ソフトウェア信頼性モデルに関するもの

ソフトウェア信頼性モデル(SRM: Software Reliability Model)
ソフトウェア信頼度成長モデル(SRGM: Software Reliability Growth Model)

障害データを用いてソフトウェアの信頼度や残存フォールト数を評価・見積もりするための確率モデル.障害発見時間に関する確率分布やその他の仮定によって多種のモデルが存在する.

指数分布モデル(Exponential SRM, Goel-Okumoto model)

障害発見時間が指数分布に従うモデル.

ガンマ分布モデル(Gamma SRM)

障害発見時間がガンマ分布に従うモデル.遅延 S 字型モデルを含む.

パレート分布モデル(Pareto SRM)

障害発見時間が二種のパレート分布に従うモデル.

切断正規分布モデル(Truncated Normal SRM)

障害発見時間が切断正規分布に従うモデル.

対数正規分布モデル(LogNormal SRM)

障害発見時間が対数正規分布に従うモデル.

切断ロジスティック分布モデル(Truncated Logistic SRM)

障害発見時間が切断ロジスティック分布に従うモデル.習熟 S 字型モデルとも呼ばれる.

対数ロジスティック分布モデル(Log-Logistc SRM)

障害発見時間が対数ロジスティック分布に従うモデル.

切断最大値分布モデル(Truncated Extreme-Value Max SRM)

障害発見時間が切断最大値分布に従うモデル.平均値はゴンペルツ曲線を描く.

対数最大値分布モデル(Log Extreme-Value Max SRM)

障害発見時間が対数最大値分布(フレシェ分布)に従うモデル.

切断最小値分布モデル(Truncated Extreme-Value Min SRM)

障害発見時間が切断最小値分布(ゴンペルツ分布)に従うモデル.

対数最小値分布モデル(Log Extreme-Value Min SRM)

障害発見時間が対数最小値分布(ワイブル分布)に従うモデル.

ソフトウェア障害・フォールトデータに関するもの

障害時間データ

障害データ形式の一つ.一つ一つの障害が発見された時刻あるいはその時間間隔を記録したもの.

障害個数データ

障害データ形式の一つ.テストケース毎,日毎,月毎などある時間区間で発見された障害の数を記録したもの.障害数と時間区間の長さをペアで記述する.

一般形

障害時間データと障害個数データを含む一般的な形式.障害個数データに期間区間の厳密に最後で障害が発見されたかどうかを表すデータを加える.

代表的なソフトウェア信頼性評価尺度

平均値関数

時刻 0 からある時間までに発見される障害の期待数.

期待残存フォールト数

その時刻でソフトウェア内に内在する期待フォールト数

Fault-Free 確率(FFprob., FFP)

その時刻ですべての障害が修正・除去されている確率.

Median

ソフトウェア信頼度が 0.5 になる時間.FFP > 0.5 の場合は無限大になる.

Be X life

ソフトウェア信頼度が 0.1 になる時間.FFP > 0.1 の場合は無限大になる.

Conditional Median

フォールトが一つ以上残っているという条件の下での Median.FFP の値に関係なく有限.

Conditional Be X life

フォールトが一つ以上残っているという条件の下での Be X life.FFP の値に関係なく有限.

MTTF

平均故障時間(Mean Time To Failure).次の障害が発生するまでの平均時間.ただし,ソフトウェア信頼性モデルではフォールトが 0 になる確率がある(FFP != 0)ので,通常の意味での MTTF は算出できない.

Conditional MTTF

仮に一つ以上のフォールトが残っているとした場合の次のバグが見つかるまでの平均時間.

Cumulative MTTF

これまでの(過去の)バグ発見時間間隔の平均.

Instantaneous MTTF

現在のバグ発見率が続く場合の平均時間.

ソフトウェア信頼度(関数)

ある時点からある時点までに障害が発生しない確率,またその時間の関数.