本記事では期待値と分散の3つの性質を示し、証明していきたいと思います。
期待値
期待値とは確率変数がとるであろう期待される値です。期待値は確率的な事象を無限回試行したときの出現値の平均になります。
離散確率分布のとき
\(x\)が離散型確率変数の場合、期待値は確率質量関数を\(f(x)\)として、以下のように表現されます。
\(E[x] = \sum_xxf(x)\)
確率質量関数\(f(x)\)は常に正で、\(\sum_xf(x) = 1\)です。
連続確率分布のとき
\(x\)が連続型確率変数の場合、期待値は確率密度関数を\(f(x)\)として、以下のように表現されます。
\(E[x] = \int xf(x)dx\)
確率密度関数\(f(x)\)は常に正で、\(\int f(x)dx = 1\)です。
分散
期待値では確率変数\(x\)が離散なのか連続なのかにより定義式が異なりました。分散も同様に確率変数が離散か連続かにより、式は異なるものになります。しかし、これは期待値の定義式が確率変数の型により異なっていることに起因しており、期待値\(E\)を式に使用してしまえば、確率変数の型によらず式は一意に表せます。
\(V[x] = E[(x - E[x])^2] = E[x^2] - (E[x])^2\)
期待値の3つの性質
確率変数を\(x\)、定数を\(c\)として期待値の3つの性質を以下に示します。
\(\begin{eqnarray}
E &=& c\\
E[x + c] &=& E[x] + c\\
E[cx] &=& cE[x]
\end{eqnarray}\)
証明
離散確率分布のとき
確率変数\(x\)が離散型確率変数のとき、期待値の定義式 \(E[x] = \sum_xxf(x)\) より、3つの式はそれぞれ、
\(\begin{eqnarray}
E &=& \sum_xcf(x) = c\sum_xf(x) = c\\
E[x + c] &=& \sum_x (x + c)f(x) = \sum_x xf(x) + c\sum_xf(x) = E[x] + c \\
E[cx] &=& \sum_x cxf(x) = c\sum_x xf(x) = cE[x]
\end{eqnarray}\)
のように証明されます。
連続確率分布のとき
確率変数\(x\)が連続型確率変数のとき、期待値の定義式 \(E[x] = \int xf(x)dx\) より、3つの式はそれぞれ、
\(\begin{eqnarray}
E &=& \int cf(x)dx = c\int f(x)dx = c\\
E[x + c] &=& \int (x + c)f(x)dx = \int xf(x)dx + c\int f(x)dx = E[x] + c \\
E[cx] &=& \int cxf(x)dx = c\int xf(x)dx = cE[x]
\end{eqnarray}\)
のように証明されます。
分散の3つの性質
確率変数を\(x\)、定数を\(c\)として分散の3つの性質を以下に示します。
\(\begin{eqnarray}
V &=& 0\\
V[x + c] &=& V[x]\\
V[cx] &=& c^2V[x]
\end{eqnarray}\)
証明
以下の証明では、確率変数の型による場合分けを省くため、期待値\(E\)をそのまま使用します。以下に証明を示します。
\(\begin{eqnarray}
V &=& E - (E)^2 = c^2 - c^2 = 0\\
V[x + c] &=& E[(x + c)^2] - (E[x + c])^2 = E[x^2] + 2cE[x] + c^2 -(E[x])^2 - 2cE[x] - c^2 = E[x^2] - (E[x])^2 = V[x]\\
V[cx] &=& E - (E[cx])^2 = c^2E[x^2] - c^2(E[x])^2 = c^2V[x]
\end{eqnarray}\)