ベイズ統計学の考え方

ベイズ統計学 では 一般的な統計学 とは前提の考え方が異なっています。
両者を比較してみましょう。

一般的な統計学では、得られた観測データというのは、唯一の真の確率分布から、ランダムに抽出されたものであると考えます。仮に、真の確率分布が正規分布であるとするならば、平均・分散は定数であり、非確率変数になります。

 

 

そのため、一般的な統計学では、得られた観測データから、背景にある確率分布を仮定し、ある定数である平均と分散を推定することが最終目標になります。

 

 

 

一方、ベイズ統計学では、背景に唯一の真の確率分布があるとは考えずに、真の確率分布は変化するものであると考えます。得られた観測データというのは、毎回異なる確率分布から、ランダムに抽出されたものであると考えます。仮に、背景の確率分布を正規分布であると仮定するならば、平均、分散が変数となり、確率変数になります。

 

 

そのため、ベイズ統計学では、得られた観測データから、背景にある確率分布を仮定し、平均・分散の確率分布を求めることが最終目標になります。

 

 

(ベイズ統計学を用いるメリット)

ベイズ統計学を用いるメリットは平均・分散といったパラメタの確率分布を求められる点にあります。

 

例えば、実験Aと実験Bの平均値に差があるか?という問題があったとします。

 

一般的な統計学では、帰無・対立仮説、有意水準を設定し、検定統計量と有意水準の大きさを比較して・・・、ということを行いますが、ベイズ統計学では、差の確率分布直接求めることができます。

   |実験Aの平均 – 実験Bの平均|>0 である確率は〇〇%。

   (実験Aの平均 – 実験Bの平均)>0 である確率は△△%

といったように、非常に直感的に解釈がしやすい結果を得ることが可能になります。これが、ベイズ統計学を用いるメリットの1つになります。

 

ベイズ統計学のもう1つのメリットは、事前パラメタの確率分布の知識を持っていれば、少数のデータでもある程度の精度を保った推定が行えることにあります。

 

(ベイズ統計学のデメリット)

ベイズ統計学を扱うためには、MCMC(マルコフ連鎖モンテカルロ法)という乱数生成アルゴリズムを用いる必要があります。プログラミングを行う必要があるため、初学者が気軽に扱えないという点がデメリットになります。