こんにちは、ひかりです。
今回は確率・統計から母分散と母比率の仮説検定について解説していきます。
この記事では以下のことを紹介します。
- 平均既知の場合における正規母集団の母分散の仮説検定について
- 平均未知の場合における正規母集団の母分散の仮説検定について
- 母比率の仮説検定について
平均既知の場合における正規母集団の母分散の仮説検定
まずは、母平均 \( \mu \) が既知の場合における正規母集団の母分散の仮説検定を考えていきましょう。
初めに、両側検定
$$ H_0:\sigma^2=\sigma^2_0, \quad H_1:\sigma^2\not=\sigma^2_0 $$
を考えます。
このとき、正規母集団から抽出した標本 \( X_1,\cdots,X_n \) に対して、
$$ (S^*)^2=\frac{1}{n}\sum_{i=1}^n(X_i-\mu)^2 $$
とおくと、確率・統計19の定理1より、
$$ \begin{align} 0.95&=P\left( \frac{n(S^*)^2}{\chi^2_{0.025}(n)}≦\sigma_0^2≦\frac{n(S^*)^2}{\chi^2_{1-0.025}(n)} \right) \\ &=P\left( \chi^2_{1-0.025}(n)≦\frac{n(S^*)^2}{\sigma_0^2}≦\chi^2_{0.025}(n) \right) \\ \end{align} $$
となります。したがって、
$$ T=\frac{n(S^*)^2}{\sigma_0^2} $$
とおくと、有意水準 \( 0.05 \) の両側検定の棄却域 \( R \) は
$$ \begin{align} 0.05&=1-0.95=1-P\left( \chi^2_{1-0.025}(n)≦T≦\chi^2_{0.025}(n) \right) \\ &=P(\{ T<\chi^2_{1-0.025}(n)\}\cup\{ T>\chi^2_{0.025}(n)\}) \end{align} $$
より、
$$ R=\{ T<\chi^2_{1-0.025}(n)\}\cup \{ T>\chi^2_{0.025}(n)\} $$
となります。同様に有意水準 \( 0.01 \) の両側検定の棄却域 \( R \) は
$$ R=\{ T<\chi^2_{1-0.005}(n) \} \cup \{ T>\chi^2_{0.005}(n) \} $$
まとめると、
母集団が正規分布 \( N(\mu,\sigma^2) \) に従っていて、母平均 \( \mu \) がわかっているとする。
また、正規母集団から抽出した標本を \( X_1,\cdots,X_n \) として、
$$ (S^*)^2=\frac{1}{n}\sum_{i=1}^n(X_i-\mu)^2 $$
とおく。
仮説 \( H_0:\sigma^2=\sigma^2_0, \quad H_1:\sigma^2\not=\sigma^2_0 \) に対して、有意水準 \( 0.05,0.01 \) の母分散 \( \sigma^2 \) の両側検定の棄却域 \( R \) は次のようになる。
検定統計量を
$$ T=\frac{n(S^*)^2}{\sigma_0^2} $$
とするとき、
$$ 有意水準0.05 \quad R=\{ T<\chi^2_{1-0.025}(n)\}\cup \{ T>\chi^2_{0.025}(n)\} $$
$$ 有意水準0.01 \quad R=\{ T<\chi^2_{1-0.005}(n) \} \cup \{ T>\chi^2_{0.005}(n) \} $$
同様に片側検定の場合は次のようになります。
母集団が正規分布 \( N(\mu,\sigma^2) \) に従っていて、母平均 \( \mu \) がわかっているとする。
また、正規母集団から抽出した標本を \( X_1,\cdots,X_n \) として、
$$ (S^*)^2=\frac{1}{n}\sum_{i=1}^n(X_i-\mu)^2 $$
とおく。
仮説 \( H_0:\sigma^2=\sigma^2_0, \quad H_1:\sigma^2<(>)\sigma^2_0 \) に対して、有意水準 \( 0.05,0.01 \) の母分散 \( \sigma^2 \) の片側検定の棄却域 \( R \) は次のようになる。
検定統計量を
$$ T=\frac{n(S^*)^2}{\sigma_0^2} $$
とするとき、
$$ 有意水準0.05 \quad R=\{ T<\chi^2_{1-0.05}(n)\} \ (\{T>\chi^2_{0.05}(n)\}) $$
$$ 有意水準0.01 \quad R=\{ T<\chi^2_{1-0.01}(n) \}\ (\{ T>\chi^2_{0.01}(n)\}) $$
ある学校の男子高校生の身長は平均 \( 167 \) (cm) の正規分布 \( N(167,\sigma^2) \) に従うことが知られている。
ここから6人を抽出したところ、次のようなデータが得られた。
$$ 163, \ 166, \ 173, \ 165, \ 170, \ 167 \ (cm) $$
このとき、母分散が \( 2.25 \) であるといえるかを有意水準 \( 0.05 \) で検定する。
まず、帰無仮説を \( H_0:\sigma^2=2.25 \) とおき、対立仮説を \( H_1:\sigma^2\not=2.25 \) とおく。
また、有意水準は \( 0.05 \) である。
帰無仮説 \( H_0 \) が正しいとすると、検定統計量
$$ T=\frac{6(S^*)^2}{2.25} $$
は自由度 \( 6 \) のカイ2乗分布 \( \chi^2(6) \) に従う。
このとき、定理1より有意水準 \( 0.05 \) の棄却域 \( R \) は
$$ \begin{align} R&=\{ T<\chi^2_{1-0.025}(6)\}\cup \{ T>\chi^2_{0.025}(6)\} \\ &=\{ T<1.237\}\cup \{ T>14.45\}\end{align} $$
となる。したがって、
$$ (S^*)^2=\frac{1}{6}\sum_{i=1}^6(x_i-167)^2=11.17 $$
より、検定統計量 \( T \) の実現値 \( T^* \) が
$$ T^*=\frac{6\times 11.17}{2.25}=29.79\in R $$
となるので、帰無仮説 \( H_0 \) は棄却される。
よって、母分散が \( 2.25 \) であるとはいえない。
平均未知の場合における正規母集団の母分散の仮説検定
まずは、母平均 \( \mu \) が未知の場合における正規母集団の母分散の仮説検定を考えていきましょう。
初めに、両側検定
$$ H_0:\sigma^2=\sigma^2_0, \quad H_1:\sigma^2\not=\sigma^2_0 $$
を考えます。
このとき、正規母集団から抽出した標本 \( X_1,\cdots,X_n \) に対して、
$$ \overline{X}=\frac{1}{n}\sum_{i=1}^nX_i, \quad S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2 $$
とおくと、確率・統計19の定理2より、
$$ \begin{align} 0.95&=P\left( \frac{(n-1)S^2}{\chi^2_{0.025}(n-1)}≦\sigma_0^2≦\frac{(n-1)S^2}{\chi^2_{1-0.025}(n-1)} \right) \\ &=P\left( \chi^2_{1-0.025}(n-1)≦\frac{(n-1)S^2}{\sigma_0^2}≦\chi^2_{0.025}(n-1) \right)\end{align} $$
となります。したがって、
$$ T=\frac{(n-1)S^2}{\sigma_0^2} $$
とおくと、有意水準 \( 0.05 \) の両側検定の棄却域 \( R \) は
$$ \begin{align} 0.05&=1-0.95=1-P\left( \chi^2_{1-0.025}(n-1)≦T≦\chi^2_{0.025}(n-1) \right) \\ &=P(\{ T<\chi^2_{1-0.025}(n-1)\}\cup\{ T>\chi^2_{0.025}(n-1)\}) \end{align} $$
より、
$$ R=\{ T<\chi^2_{1-0.025}(n-1)\}\cup \{ T>\chi^2_{0.025}(n-1)\} $$
となります。同様に有意水準 \( 0.01 \) の両側検定の棄却域 \( R \) は
$$ R=\{ T<\chi^2_{1-0.005}(n-1) \} \cup \{ T>\chi^2_{0.005}(n-1) \} $$
まとめると、
母集団が正規分布 \( N(\mu,\sigma^2) \) に従っていて、母平均 \( \mu \) がわかっていないとする。
また、正規母集団から抽出した標本を \( X_1,\cdots,X_n \) として、
$$ \overline{X}=\frac{1}{n}\sum_{i=1}^nX_i, \quad S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2 $$
とおく。
仮説 \( H_0:\sigma^2=\sigma^2_0, \quad H_1:\sigma^2\not=\sigma^2_0 \) に対して、有意水準 \( 0.05,0.01 \) の母分散 \( \sigma^2 \) の両側検定の棄却域 \( R \) は次のようになる。
検定統計量を
$$ T=\frac{(n-1)S^2}{\sigma_0^2} $$
とするとき、
$$ 有意水準0.05 \quad R=\{ T<\chi^2_{1-0.025}(n-1)\}\cup \{ T>\chi^2_{0.025}(n-1)\} $$
$$ 有意水準0.01 \quad R=\{ T<\chi^2_{1-0.005}(n-1) \} \cup \{ T>\chi^2_{0.005}(n-1) \} $$
同様に片側検定の場合は次のようになります。
母集団が正規分布 \( N(\mu,\sigma^2) \) に従っていて、母平均 \( \mu \) がわかっていないとする。
また、正規母集団から抽出した標本を \( X_1,\cdots,X_n \) として、
$$ \overline{X}=\frac{1}{n}\sum_{i=1}^nX_i, \quad S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2 $$
とおく。
仮説 \( H_0:\sigma^2=\sigma^2_0, \quad H_1:\sigma^2<(>)\sigma^2_0 \) に対して、有意水準 \( 0.05,0.01 \) の母分散 \( \sigma^2 \) の片側検定の棄却域 \( R \) は次のようになる。
検定統計量を
$$ T=\frac{(n-1)S^2}{\sigma_0^2} $$
とするとき、
$$ 有意水準0.05 \quad R=\{ T<\chi^2_{1-0.05}(n-1)\} \ (\{T>\chi^2_{0.05}(n-1)\}) $$
$$ 有意水準0.01 \quad R=\{ T<\chi^2_{1-0.01}(n-1) \}\ (\{ T>\chi^2_{0.01}(n-1)\}) $$
ある役所の窓口にかかる電話の時間を10件分計ったところ、標本分散は \( S^2=45 \) であった。
このとき、母分散が \( \sigma^2=25 \) であるといえるかを有意水準 \( 0.05 \) で検定する。
まず、帰無仮説を \( H_0:\sigma^2=25 \) とおき、対立仮説を \( H_1:\sigma^2\not=25 \) とおく。
また、有意水準は \( 0.05 \) である。
帰無仮説 \( H_0 \) が正しいとすると、検定統計量
$$ T=\frac{9S^2}{25} $$
は自由度 \( 9 \) のカイ2乗分布 \( \chi^2(9) \) に従う。
このとき、定理3より有意水準 \( 0.05 \) の棄却域 \( R \) は
$$ \begin{align} R&=\{ T<\chi^2_{1-0.025}(9)\}\cup \{ T>\chi^2_{0.025}(9)\} \\ &=\{ T<2.70\}\cup \{ T>19.02\}\end{align} $$
となる。したがって、
$$ S^2=45 $$
より、検定統計量 \( T \) の実現値 \( T^* \) が
$$ T^*=\frac{9\times 45}{25}=16.2\not\in R $$
となるので、帰無仮説 \( H_0 \) は受容される。
よって、母分散が \( 25 \) でないとはいいきれない。
(母分散が \( 25 \) であるとまではいえないことに注意)
母比率の仮説検定
大標本の場合
まずは、標本数 \( n \) が十分大きい場合における母比率の仮説検定を考えていきましょう。
初めに、両側検定
$$ H_0:p=p_0, \quad H_1:p\not=p_0 $$
を考えます。
このとき、ある特性の母比率が \( p \) の母集団から \( n \) 個標本を抽出して、その特性をもっている標本の個数を \( X \) とおくと、確率・統計19の定理3より、
$$ \begin{align} 0.95&=P\left( \frac{X}{n}-1.96\frac{\sqrt{X(1-\frac{X}{n})}}{n}≦p_0≦\frac{X}{n}+1.96\frac{\sqrt{X(1-\frac{X}{n})}}{n} \right) \\ &=P\left( -1.96≦\frac{X-np_0}{\sqrt{X(1-\frac{X}{n})}}≦1.96 \right) \\ &=P\left( -1.96≦\frac{X-np_0}{\sqrt{np_0(1-p_0)}}≦1.96 \right) \end{align} $$
となります。したがって、
$$ T=\frac{X-np_0}{\sqrt{np_0(1-p_0)}} $$
とおくと、有意水準 \( 0.05 \) の両側検定の棄却域 \( R \) は
$$ \begin{align} 0.05&=1-0.95=1-P\left( -1.96≦T≦1.96 \right) \\ &=P(\{ T<-1.96\}\cup\{ T>1.96\}) \end{align} $$
より、
$$ R=\{ T<-1.96\}\cup \{ T>1.96\} $$
となります。同様に有意水準 \( 0.01 \) の両側検定の棄却域 \( R \) は
$$ R=\{ T<-2.58 \} \cup \{ T>2.58 \} $$
まとめると、
ある特性の母比率が \( p \) の母集団から \( n \) 個標本を抽出して、その特性をもっている標本の個数を \( X \) とおく。
ただし、標本数 \( n \) は十分大きいとする。
(目安は \( np≧5 \) かつ \( n(1-p)≧5 \))
仮説 \( H_0:p=p_0, \quad H_1:p\not=p_0 \) に対して、有意水準 \( 0.05,0.01 \) の母比率 \( p \) の両側検定の棄却域 \( R \) は次のようになる。
検定統計量を
$$ T=\frac{X-np_0}{\sqrt{np_0(1-p_0)}} $$
とするとき、
$$ 有意水準0.05 \quad R=\{ T<-1.96\}\cup \{ T>1.96\} $$
$$ 有意水準0.01 \quad R=\{ T<-2.58 \} \cup \{ T>2.58 \} $$
同様に片側検定の場合は次のようになります。
ある特性の母比率が \( p \) の母集団から \( n \) 個標本を抽出して、その特性をもっている標本の個数を \( X \) とおく。
ただし、標本数 \( n \) は十分大きいとする。
(目安は \( np≧5 \) かつ \( n(1-p)≧5 \))
仮説 \( H_0:p=p_0, \quad H_1:p<(>)p_0 \) に対して、有意水準 \( 0.05,0.01 \) の母比率 \( p \) の片側検定の棄却域 \( R \) は次のようになる。
検定統計量を
$$ T=\frac{X-np_0}{\sqrt{np_0(1-p_0)}} $$
とするとき、
$$ 有意水準0.05 \quad R=\{ T<-1.645\} \ (\{T>1.645\}) $$
$$ 有意水準0.01 \quad R=\{ T<-2.33 \}\ (\{ T>2.33\}) $$
ある地域の中学生の中から2400人にスマートフォンを持っているかどうかを調査したところ1250人が持っていると答えた。
このとき、この地域の中学生は二人に一人スマートフォンを持っているといえるかを有意水準 \( 0.05 \) で検定する。
まず、帰無仮説を \( H_0:p=\frac{1}{2} \) とおき、対立仮説を \( H_1:p>\frac{1}{2} \) とおく。
(明らかに \( \frac{1}{2} \) を超えることが想定されるので片側検定をする)
また、有意水準は \( 0.05 \) である。
帰無仮説 \( H_0 \) が正しいとすると、検定統計量
$$ T=\frac{X-2400\times \frac{1}{2}}{\sqrt{2400\times \frac{1}{2}(1-\frac{1}{2})}} $$
は標準正規分布 \( N(0,1) \) に従う。
このとき、定理6より有意水準 \( 0.05 \) の棄却域 \( R \) は
$$ \begin{align} R&=\{T>1.645\} \end{align} $$
となる。したがって、
$$ X=1250 $$
より、検定統計量 \( T \) の実現値 \( T^* \) が
$$ T^*=\frac{1250-2400\times \frac{1}{2}}{\sqrt{2400\times \frac{1}{2}(1-\frac{1}{2})}}=2.04\in R $$
となるので、帰無仮説 \( H_0 \) は棄却される。
よって、この地域の中学生は二人に一人スマートフォンを持っているといえない。
(もっと多くの人が持っているといえる)
小標本の場合
最後に、標本数 \( n \) が少ない場合における母比率の仮説検定を考えていきましょう。
初めに、両側検定
$$ H_0:p=p_0, \quad H_1:p\not=p_0 $$
を考えます。
このとき、ある特性の母比率が \( p \) の母集団から \( n \) 個標本を抽出して、その特性をもっている標本の個数の実現値を \( x=k \) とおいて、
$$ \begin{cases} m_1=2(n-k+1) \\ n_1=2k \end{cases} \quad \begin{cases} m_2=2(k+1) \\ n_2=2(n-k) \end{cases} $$
とおくと、確率・統計19の定理4より、
$$ \begin{align} 0.95&=P\left( \frac{n_1}{m_1F_{0.025}(m_1,n_1)+n_1}≦p_0≦\frac{m_2F_{0.025}(m_2,n_2)}{m_2F_{0.025}(m_2,n_2)+n_2} \right) \\ &=P\left( \frac{k(1-p_0)}{(n-k+1)p_0}≦F_{0.025}(m_1,n_1), \ \frac{(n-k)p_0}{(k+1)(1-p_0)}≦F_{0.025}(m_2,n_2) \right) \end{align} $$
となります。したがって、
$$ T_1=\frac{k(1-p_0)}{(n-k+1)p_0}, \quad T_2=\frac{(n-k)p_0}{(k+1)(1-p_0)} $$
とおくと、有意水準 \( 0.05 \) の両側検定の棄却域 \( R \) は
$$ \begin{align} 0.05&=1-0.95=1-P\left( T_1≦F_{0.025}(m_1,n_1), \ T_2≦F_{0.025}(m_2,n_2) \right) \\ &=P(\{ T_1>F_{0.025}(m_1,n_1)\}\cup\{ T_2>F_{0.025}(m_2,n_2)\}) \end{align} $$
より、
$$ R=\{ T_1>F_{0.025}(m_1,n_1)\}\cup \{ T_2>F_{0.025}(m_2,n_2)\} $$
となります。同様に有意水準 \( 0.01 \) の両側検定の棄却域 \( R \) は
$$ R=\{ T_1>F_{0.005}(m_1,n_1)\}\cup \{ T_2>F_{0.005}(m_2,n_2)\} $$
まとめると、
ある特性の母比率が \( p \) の母集団から \( n \) 個標本を抽出して、その特性をもっている標本の個数を \( X \) とおく。
ただし、標本数 \( n \) は少ないとする。
仮説 \( H_0:p=p_0, \quad H_1:p\not=p_0 \) に対して、有意水準 \( 0.05,0.01 \) の母比率 \( p \) の両側検定の棄却域 \( R \) は次のようになる。
\( X \) の実現値を \( k(≦n) \) とするとき、
$$ \begin{cases} m_1=2(n-k+1) \\ n_1=2k \end{cases} \quad \begin{cases} m_2=2(k+1) \\ n_2=2(n-k) \end{cases} $$
とおいて、検定統計量を
$$ T_1=\frac{k(1-p_0)}{(n-k+1)p_0}, \quad T_2=\frac{(n-k)p_0}{(k+1)(1-p_0)} $$
とするとき、
$$ 有意水準0.05 \quad R=\{ T_1>F_{0.025}(m_1,n_1)\}\cup \{ T_2>F_{0.025}(m_2,n_2)\} $$
$$ 有意水準0.01 \quad R=\{ T_1>F_{0.005}(m_1,n_1)\}\cup \{ T_2>F_{0.005}(m_2,n_2)\} $$
同様に片側検定の場合は次のようになります。
ある特性の母比率が \( p \) の母集団から \( n \) 個標本を抽出して、その特性をもっている標本の個数を \( X \) とおく。
ただし、標本数 \( n \) は少ないとする。
仮説 \( H_0:p=p_0, \quad H_1:p<(>)p_0 \) に対して、有意水準 \( 0.05,0.01 \) の母比率 \( p \) の片側検定の棄却域 \( R \) は次のようになる。
\( X \) の実現値を \( k(≦n) \) とするとき、
$$ \begin{cases} m_1=2(n-k+1) \\ n_1=2k \end{cases} \quad \begin{cases} m_2=2(k+1) \\ n_2=2(n-k) \end{cases} $$
とおいて、検定統計量を
$$ T_1=\frac{k(1-p_0)}{(n-k+1)p_0}, \quad T_2=\frac{(n-k)p_0}{(k+1)(1-p_0)} $$
とするとき、
$$ 有意水準0.05 \quad R=\{ T_2>F_{0.05}(m_1,n_1)\} \ (\{T_1>F_{0.05}(m_2,n_2)\}) $$
$$ 有意水準0.01 \quad R=\{ T_2>F_{0.01}(m_1,n_1)\} \ (\{T_1>F_{0.01}(m_2,n_2)\}) $$
コインを19回投げたところ、表が5回出て残りは裏だった。
このとき、このコインの表がでる確率は \( \frac{1}{2} \) でないといえるかを有意水準 \( 0.05 \) で検定する。
まず、帰無仮説を \( H_0:p=\frac{1}{2} \) とおき、対立仮説を \( H_1:p\not=\frac{1}{2} \) とおく。
また、有意水準は \( 0.05 \) である。
帰無仮説 \( H_0 \) が正しいとすると、検定統計量
$$ T_1=\frac{X(1-\frac{1}{2})}{(19-X+1)\frac{1}{2}}, \quad T_2=\frac{(19-X)\frac{1}{2}}{(X+1)(1-\frac{1}{2})} $$
はそれぞれ自由度 \( (2(19-X+1),2X) \) と \( (2(X+1),2(19-X)) \) の \( F \) 分布 \( F(2(19-X+1),2X),F(2(X+1),2(19-X)) \) に従う。
このとき、
$$ X=5 $$
であるので、定理7より有意水準 \( 0.05 \) の棄却域 \( R \) は
$$ \begin{align} R&=\{ T_1>F_{0.025}(30,10)\}\cup \{ T_2>F_{0.025}(12,28)\} \\ &=\{ T_1>3.31\}\cup \{ T_2>2.45\} \end{align} $$
となる。したがって、検定統計量 \( T_1,T_2 \) の実現値 \( T_1^*,T_2^* \) が
$$ T_1=\frac{5(1-\frac{1}{2})}{(19-5+1)\frac{1}{2}}=0.333\not\in R, \quad T_2=\frac{(19-5)\frac{1}{2}}{(5+1)(1-\frac{1}{2})}=2.333\not\in R $$
となるので、帰無仮説 \( H_0 \) は受容される。
よって、このコインの表がでる確率は \( \frac{1}{2} \) でないとまでは言えない。
(このコインの表がでる確率は \( \frac{1}{2} \) であるとまではいえないことに注意)
今回はここまでです。お疲れ様でした。また次回にお会いしましょう。