統計量の公式

命題を統計的に証明する流れ(こちらをご参照)を感覚的に理解したとしても、統計量公式だけは覚えなければなりません。暗記にどこまで意味があるか疑問ですが、試験勉強だと割り切って纏めておきます。このページで記載した数式は、1データと複数データの平均をどちらもxと記載していたり、2乗をきちんと表現できていなかったりで不完全です。高度な試験や論文には通用しません。専用のプラグインを用いればきれいに書けるのでしょうが、面倒くさいので端折りました(ちなみにMS Wordには、数式をきれいに表現できる機能が備わっていました)。

Z値(標準正規分布の検定に使う統計量)

Z = (x – μ) / σ

Z値は、誤差(データと平均μとの差)を標準偏差σで割ったもの。Z値の絶対値が1.96よりも大きいとき、帰無仮説が正しい確率は5%以下。即ち、帰無仮説は棄却されます。標準正規分布ではσ=1なので、1.96は2σより少し小さい。ちなみに標準正規分布はσの大きさで形状が決まるので、いつでも1σで68.3%、2σで95.5%、3σで99.7%をカバーします。

t値(t分布の検定に使う統計量)

t = (x – μ) / √(s2 / n)

1サンプル(データ数n個)の場合のt値です。xはデータの平均値、sの2乗は不偏分散、nはデータ数です。Z値と分子が異なりますが、分散の平方根σが、不偏分散sの2乗をデータ数nで割った平方根に置き換わっているだけで、形は似ています。自由度(n-1)のt分布で、t値を評価します。

カイ2乗値(カイ2乗分布の検定に使う統計量)

カイ2乗値 = ∑(観測値 – 理論値)2乗 / 理論値

数式の記載になっていませんが、観測値と理論値の差の2乗を理論値で割った数を足しあげたものがカイ2乗値です。カイ2乗分布は自由度によって形状が決まりますが、自由度というのは自由に取れる値の数なので、n行m列のデータを使う場合の自由度は(n-1)×(m-1)になります。試験では、1か2の自由度のカイ2乗分布で、カイ2乗値を評価します。

ブログを更新したときや、趣味やビジネスに関する興味深い記事を見つけたときにTweetしています!