arisaka444のブログ

ツイッター(@arisaka444)

不偏分散の期待値について

偏差平方和を標本の大きさで割って得られる標本分散S ^ { 2 }、および、偏差平方和を自由度で割ることにより得られる不偏分散U ^ { 2 }について、次のように定められる。

S ^ { 2 } = \frac { 1 } { n } \sum _ { i = 1 } ^ { n } \left( X _ { i } - \overline { X } \right) ^ { 2 }

U ^ { 2 } = \frac { 1 } { n - 1 } \sum _ { i = 1 } ^ { n } \left( X _ { i } - \overline { X } \right) ^ { 2 }

不偏分散は母分散の不偏推定量であり、その期待値は母分散に等しい。本記事では、この事実を計算により確認する。


まずは、標本分散S ^ { 2 }の期待値を確認する。

E \left[ S ^ { 2 } \right]

= E \left[ \frac { 1 } { n } \sum _ { i = 1 } ^ { n } \left( X _ { i } - \overline { X } \right) ^ { 2 } \right]

= \frac { 1 } { n } \sum _ { i = 1 } ^ { n } E \left[ \left\{ \left( X _ { i } - \mu \right) - ( \overline { X } - \mu ) \right\} ^ { 2 } \right]

= \frac { 1 } { n } \sum _ { i = 1 } ^ { n } E \left[ \left( X _ { i } - \mu \right) ^ { 2 } - 2 \left( X _ { i } - \mu \right) ( \overline { X } - \mu ) + ( \overline { X } - \mu ) ^ { 2 } \right]

= \frac { 1 } { n } \sum _ { i = 1 } ^ { n } \left( E \left[ \left( X _ { i } - \mu \right) ^ { 2 } \right] - 2 E \left[ \left( X _ { i } - \mu \right) ( \overline { X } - \mu ) \right] + E \left[ ( \overline { X } - \mu ) ^ { 2 } \right] \right)

= \frac { 1 } { n } \sum _ { i = 1 } ^ { n } \left( V [ X ] - 2 E \left[ \left( X _ { i } - \mu \right) ( \overline { X } - \mu ) \right] + V [ \overline { X } ] \right)

= \frac { 1 } { n } \sum _ { i = 1 } ^ { n } \left( \sigma ^ { 2 } - 2 E \left[ \left( X _ { i } - \mu \right) ( \overline { X } - \mu ) \right] + \frac { \sigma ^ { 2 } } { n } \right)

= \sigma ^ { 2 } - \frac { 2 } { n } \sum _ { i = 1 } ^ { n } E \left[ \left( X _ { i } - \mu \right) ( \overline { X } - \mu ) \right] + \frac { \sigma ^ { 2 } } { n }

ここで

\sum _ { i = 1 } ^ { n } E \left[ \left( X _ { i } - \mu \right) ( \overline { X } - \mu ) \right]

= E \left[ ( \overline { X } - \mu ) \sum _ { i = 1 } ^ { n } \left( X _ { i } - \mu \right) \right]

= E \left[ ( \overline { X } - \mu ) \left( \sum _ { i = 1 } ^ { n } X _ { i } - \sum _ { i = 1 } ^ { n } \mu \right) \right]

= E [ ( \overline { X } - \mu ) ( n \overline { X } - n \mu ) ]

= n E [ ( \overline { X } - \mu ) ( \overline { X } - \mu ) ]

= n E \left[ ( \overline { X } - \mu ) ^ { 2 } \right]

= n V [ \overline { X } ]

= n \cdot \frac { \sigma ^ { 2 } } { n }

= \sigma ^ { 2 }

したがって

E \left[ S ^ { 2 } \right]

= \sigma ^ { 2 } - \frac { 2 } { n } \sigma ^ { 2 } + \frac { \sigma ^ { 2 } } { n }

= \left( 1 - \frac { 2 } { n } + \frac { 1 } { n } \right) \sigma ^ { 2 }

= \frac { n - 1 } { n } \sigma ^ { 2 }

ゆえに、標本分散S ^ { 2 }の期待値は、母分散\sigma ^ { 2 }には一致せず、母分散を\frac { n - 1 } { n }倍したものとなる。


次に、ここまでの計算結果を利用して、不偏分散U ^ { 2 }の期待値を確認する。

上記で得られた

E \left[ S ^ { 2 } \right] = \frac { n - 1 } { n } \sigma ^ { 2 }

の両辺に\frac { n } { n - 1 }を掛けると

\frac { n } { n - 1 } E \left[ S ^ { 2 } \right] = \sigma ^ { 2 }

より

E \left[ \frac { n } { n - 1 } S ^ { 2 } \right] = \sigma ^ { 2 }

となる。ここで

\frac { n } { n - 1 } S ^ { 2 }

= \frac { n } { n - 1 } \cdot \frac { 1 } { n } \sum _ { i = 1 } ^ { n } \left( X _ { i } - \overline { X } \right) ^ { 2 }

= \frac { 1 } { n - 1 } \sum _ { i = 1 } ^ { n } \left( X _ { i } - \overline { X } \right) ^ { 2 }

これは、不偏分散U ^ { 2 }にほかならない。

すなわち

E \left[ U ^ { 2 } \right] = \sigma ^ { 2 }

であり、不偏分散の期待値は母分散に等しい。


【参考文献】
回帰分析入門、豊田秀樹 編、東京図書、2012