信頼区間とベイズ信頼区間について
混乱するのでまとめました。
信頼区間 Confidence interval
区間推定
データがとして得られているとします。 このデータが確率分布から生成されていると仮定します。
区間推定では真のパラメーターがある区間に入る確率を以上になるようなを求めます。 具体的な形で書くと、
LとUは標本分布から計算されます。 つまり、別のsampleで計算したら信頼区間の推定値は変わります。 真のパラメーターは定数なので、信頼区間に入っているかいないかのどちらかしかありえません。 そのため「区間に真のパラメーターが入っている確率が何々」とは言えません。 正確には、なんどもsampleを取り直して、区間推定を行えば、 「の確率で、真のパラメーターが入った区間がえられる。」
比較対象として点推定についても載せます。
おまけ:点推定(最尤推定)
データがとして得られているとします。 このデータが確率分布から生成されていると仮定します。 その際、モデルのパラメーターがで与えられるとします。
この時に、尤度を最大にするのが最尤推定です。 尤度とは
と書けて、要するに、パラメータを決めたときに、データが得られる可能性のことです。 これを最大にするということは、最も尤もらしいパラメーターをえることです。
ベイズ信頼区間 Credible interval
ベイズ推定
ベイズ推定では、最尤推定とは異なり、パラメーターの分布を求めます。 事前分布を仮定する必要があります。
左辺がパラメーターの事後分布です。
ベイズ信頼区間(Credible interval, Bayesian confidence interval)は 事後分布の両端を%分の面積だけ落として、残った分の区間をベイズ信頼区間と呼びます。 この場合は、区間推定の時とは異なり、が変数なので、 「が区間にある確率はである」と言えます。