確率・統計(統計検定2級対応)23:2つの母集団の母数に関する仮説検定

こんにちは、ひかりです。

今回は確率・統計から2つの母集団の母数に関する仮説検定について解説していきます。

この記事では以下のことを紹介します。

  • 2つの正規母集団の母平均の差の仮説検定について
  • 2つの正規母集団の母分散の比の仮説検定(等分散仮説の検定)について
  • 2つの母比率の差の仮説検定について
目次

2つの正規母集団の母平均の差の仮説検定

母分散が既知の場合

まずは、母分散 \( \sigma_1^2,\sigma^2_2 \) が既知の場合における2つの正規母集団の母平均の差 \( \mu_1-\mu_2 \) の仮説検定を考えていきましょう。

初めに、両側検定

$$ H_0:\mu_1=\mu_2, \quad H_1:\mu_1\not=\mu_2 $$

を考えます。

(つまり、帰無仮説では母平均の差はない \( \mu_1-\mu_2=0 \) と仮定するわけです)

このとき、それぞれの正規母集団から抽出した標本 \( X_1,\cdots,X_m \) と \( Y_1,\cdots,Y_n \) に対して、

$$ \overline{X}=\frac{1}{m}\sum_{i=1}^mX_i, \quad \overline{Y}=\frac{1}{n}\sum_{i=1}^nY_i $$

とおくと、確率・統計20の定理1より、

$$ \begin{align} 0.95&=P\left( (\overline{X}-\overline{Y})-1.96\sqrt{\frac{\sigma^2_1}{m}+\frac{\sigma^2_2}{n}}≦\mu_1-\mu_2≦(\overline{X}-\overline{Y})+1.96\sqrt{\frac{\sigma^2_1}{m}+\frac{\sigma^2_2}{n}} \right) \\ &=P\left( -1.96≦\frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma^2_1}{m}+\frac{\sigma^2_2}{n}}}≦1.96 \right) \end{align} $$

となります。したがって、帰無仮説 \( H_0:\mu_1=\mu_2 \) が成り立つので、

$$ T=\frac{\overline{X}-\overline{Y}}{\sqrt{\frac{\sigma^2_1}{m}+\frac{\sigma^2_2}{n}}} $$

とおくと、有意水準 \( 0.05 \) の両側検定の棄却域 \( R \) は

$$ \begin{align} 0.05&=1-0.95=1-P\left( -1.96≦T≦1.96 \right) \\ &=P(\{ T<-1.96\}\cup\{ T>1.96\}) \end{align} $$

より、

$$ R=\{ T<-1.96\}\cup\{ T>1.96\} $$

となります。同様に有意水準 \( 0.01 \) の両側検定の棄却域 \( R \) は

$$ R=\{ T<-2.58\}\cup\{ T>2.58\} $$

まとめると、

定理1 (分散既知の場合における2つの正規母集団の母平均の差の両側仮説検定)

2つの母集団がそれぞれ正規分布 \( N(\mu_1,\sigma_1^2),N(\mu_2,\sigma^2_2) \) に従っていて、母分散 \( \sigma^2_1,\sigma^2_2 \) がわかっているとする。

また、それぞれの正規母集団から抽出した標本を \( X_1,\cdots,X_m \) と \( Y_1,\cdots, Y_n \) として、

$$ \overline{X}=\frac{1}{m}\sum_{i=1}^mX_i, \quad \overline{Y}=\frac{1}{n}\sum_{i=1}^nY_i $$

とおく。

仮説 \( H_0:\mu_1=\mu_2, \quad H_1:\mu_1\not=\mu_2 \) に対して、有意水準 \( 0.05,0.01 \) の母平均の差 \( \mu_1-\mu_2 \) の両側検定の棄却域 \( R \) は次のようになる。

検定統計量を

$$ T=\frac{\overline{X}-\overline{Y}}{\sqrt{\frac{\sigma^2_1}{m}+\frac{\sigma^2_2}{n}}} $$

とするとき、

$$ 有意水準0.05 \quad R=\{ T<-1.96\}\cup\{ T>1.96\} $$

$$ 有意水準0.01 \quad R=\{ T<-2.58\}\cup\{ T>2.58\} $$

同様に片側検定の場合は次のようになります。

定理2 (分散既知の場合における2つの正規母集団の母平均の差の片側仮説検定)

2つの母集団がそれぞれ正規分布 \( N(\mu_1,\sigma_1^2),N(\mu_2,\sigma^2_2) \) に従っていて、母分散 \( \sigma^2_1,\sigma^2_2 \) がわかっているとする。

また、それぞれの正規母集団から抽出した標本を \( X_1,\cdots,X_m \) と \( Y_1,\cdots, Y_n \) として、

$$ \overline{X}=\frac{1}{m}\sum_{i=1}^mX_i, \quad \overline{Y}=\frac{1}{n}\sum_{i=1}^nY_i $$

とおく。

仮説 \( H_0:\mu_1=\mu_2, \quad H_1:\mu_1<(>)\mu_2 \) に対して、有意水準 \( 0.05,0.01 \) の母平均の差 \( \mu_1-\mu_2 \) の片側検定の棄却域 \( R \) は次のようになる。

検定統計量を

$$ T=\frac{\overline{X}-\overline{Y}}{\sqrt{\frac{\sigma^2_1}{m}+\frac{\sigma^2_2}{n}}} $$

とするとき、

$$ 有意水準0.05 \quad R=\{ T<-1.645\} \ (\{T>1.645\}) $$

$$ 有意水準0.01 \quad R=\{ T<-2.33 \}\ (\{ T>2.33\}) $$

例1

機械 \( A \) と機械 \( B \) で作られたある製品の重量はそれぞれ正規分布 \( N(\mu_1,15.72),N(\mu_2,16.03) \) に従うことが知られている。

ここで、それぞれの機械の製品をそれぞれ100個と150個抽出して、平均重量を調べたところそれぞれ371.1gと369.8gであった。

このとき、機械 \( A \) と機械 \( B \) で作られたこの製品の平均重量に差があるといえるかを有意水準 \( 0.01 \) で検定する。

まず、帰無仮説を \( H_0:\mu_1=\mu_2 \) とおき、対立仮説を \( H_1:\mu_1\not=\mu_2 \) とおく。

また、有意水準は \( 0.01 \) である。

帰無仮説 \( H_0 \) が正しいとすると、検定統計量

$$ T=\frac{\overline{X}-\overline{Y}}{\sqrt{\frac{15.72}{100}+\frac{16.03}{150}}} $$

は標準正規分布 \( N(0,1) \) に従う。

このとき、定理1より有意水準 \( 0.01 \) の棄却域 \( R \) は

$$ \begin{align} R&=\{ T<-2.58\}\cup\{ T>2.58\} \end{align} $$

となる。したがって、

$$ \overline{X}=371.1, \quad \overline{Y}=369.8 $$

より、検定統計量 \( T \) の実現値 \( T^* \) が

$$ T^*=\frac{371.1-369.8}{\sqrt{\frac{15.72}{100}+\frac{16.03}{150}}}=2.53\not\in R $$

となるので、帰無仮説 \( H_0 \) は受容される。

よって、機械 \( A \) と機械 \( B \) で作られたこの製品の平均重量に差があるとはいいきれない。

(機械 \( A \) と機械 \( B \) で作られたこの製品の平均重量に差がないとまではいえないことに注意)

母分散が未知で標本数が十分大きい場合

次に、母分散 \( \sigma_1^2,\sigma^2_2 \) が未知で標本数 \( m,n \) が十分大きい場合(目安は \( m,n≧50 \) )における2つの正規母集団の母平均の差 \( \mu_1-\mu_2 \) の仮説検定を考えていきましょう。

初めに、両側検定

$$ H_0:\mu_1=\mu_2, \quad H_1:\mu_1\not=\mu_2 $$

を考えます。

(つまり、帰無仮説では母平均の差はない \( \mu_1-\mu_2=0 \) と仮定するわけです)

このとき、それぞれの正規母集団から抽出した標本 \( X_1,\cdots,X_m \) と \( Y_1,\cdots,Y_n \) に対して、

$$ \overline{X}=\frac{1}{m}\sum_{i=1}^mX_i, \quad \overline{Y}=\frac{1}{n}\sum_{i=1}^nY_i $$

$$ S_1^2=\frac{1}{m-1}\sum_{i=1}^m(X_i-\overline{X})^2, \quad S_2^2=\frac{1}{n-1}\sum_{i=1}^n(Y_i-\overline{Y})^2 $$

とおくと、確率・統計20の定理2より、

$$ \begin{align} 0.95&=P\left( (\overline{X}-\overline{Y})-1.96\sqrt{\frac{S^2_1}{m}+\frac{S^2_2}{n}}≦\mu_1-\mu_2≦(\overline{X}-\overline{Y})+1.96\sqrt{\frac{S^2_1}{m}+\frac{S^2_2}{n}} \right) \\ &=P\left( -1.96≦\frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{S^2_1}{m}+\frac{S^2_2}{n}}}≦1.96 \right) \end{align} $$

となります。したがって、帰無仮説 \( H_0:\mu_1=\mu_2 \) が成り立つので、

$$ T=\frac{\overline{X}-\overline{Y}}{\sqrt{\frac{S^2_1}{m}+\frac{S^2_2}{n}}} $$

とおくと、有意水準 \( 0.05 \) の両側検定の棄却域 \( R \) は

$$ \begin{align} 0.05&=1-0.95=1-P\left( -1.96≦T≦1.96 \right) \\ &=P(\{ T<-1.96\}\cup\{ T>1.96\}) \end{align} $$

より、

$$ R=\{ T<-1.96\}\cup\{ T>1.96\} $$

となります。同様に有意水準 \( 0.01 \) の両側検定の棄却域 \( R \) は

$$ R=\{ T<-2.58\}\cup\{ T>2.58\} $$

まとめると、

定理3 (分散未知で大標本の場合における2つの正規母集団の母平均の差の両側仮説検定)

2つの母集団がそれぞれ正規分布 \( N(\mu_1,\sigma_1^2),N(\mu_2,\sigma^2_2) \) に従っていて、母分散 \( \sigma_1^2,\sigma^2_2 \) がわかっていないとする。

また、2つの正規母集団から十分多く(目安は \( m,n≧50 \))抽出した標本をそれぞれ \( X_1,\cdots,X_m \) と \( Y_1,\cdots,Y_n \) として、

$$ \overline{X}=\frac{1}{m}\sum_{i=1}^mX_i, \quad \overline{Y}=\frac{1}{n}\sum_{i=1}^nY_i $$

$$ S_1^2=\frac{1}{m-1}\sum_{i=1}^m(X_i-\overline{X})^2, \quad S_2^2=\frac{1}{n-1}\sum_{i=1}^n(Y_i-\overline{Y})^2 $$

とおく。

仮説 \( H_0:\mu_1=\mu_2, \quad H_1:\mu_1\not=\mu_2 \) に対して、有意水準 \( 0.05,0.01 \) の母平均の差 \( \mu_1-\mu_2 \) の両側検定の棄却域 \( R \) は次のようになる。

検定統計量を

$$ T=\frac{\overline{X}-\overline{Y}}{\sqrt{\frac{S^2_1}{m}+\frac{S^2_2}{n}}} $$

とするとき、

$$ 有意水準0.05 \quad R=\{ T<-1.96\}\cup\{ T>1.96\} $$

$$ 有意水準0.01 \quad R=\{ T<-2.58\}\cup\{ T>2.58\} $$

同様に片側検定の場合は次のようになります。

定理4 (分散未知で大標本の場合における2つの正規母集団の母平均の差の片側仮説検定)

2つの母集団がそれぞれ正規分布 \( N(\mu_1,\sigma_1^2),N(\mu_2,\sigma^2_2) \) に従っていて、母分散 \( \sigma_1^2,\sigma^2_2 \) がわかっていないとする。

また、2つの正規母集団から十分多く(目安は \( m,n≧50 \))抽出した標本をそれぞれ \( X_1,\cdots,X_m \) と \( Y_1,\cdots,Y_n \) として、

$$ \overline{X}=\frac{1}{m}\sum_{i=1}^mX_i, \quad \overline{Y}=\frac{1}{n}\sum_{i=1}^nY_i $$

$$ S_1^2=\frac{1}{m-1}\sum_{i=1}^m(X_i-\overline{X})^2, \quad S_2^2=\frac{1}{n-1}\sum_{i=1}^n(Y_i-\overline{Y})^2 $$

とおく。

仮説 \( H_0:\mu_1=\mu_2, \quad H_1:\mu_1<(>)\mu_2 \) に対して、有意水準 \( 0.05,0.01 \) の母平均の差 \( \mu_1-\mu_2 \) の片側検定の棄却域 \( R \) は次のようになる。

検定統計量を

$$ T=\frac{\overline{X}-\overline{Y}}{\sqrt{\frac{S^2_1}{m}+\frac{S^2_2}{n}}} $$

とするとき、

$$ 有意水準0.05 \quad R=\{ T<-1.645\} \ (\{T>1.645\}) $$

$$ 有意水準0.01 \quad R=\{ T<-2.33 \}\ (\{ T>2.33\}) $$

標本数が少なく母分散が未知だが等分散である場合

こんどは、母分散 \( \sigma_1^2,\sigma^2_2 \) が未知で標本数 \( m,n \) が少なく、等分散 \( \sigma^2_1=\sigma^2_2=\sigma^2 \) における2つの正規母集団の母平均の差 \( \mu_1-\mu_2 \) の仮説検定を考えていきましょう。

初めに、両側検定

$$ H_0:\mu_1=\mu_2, \quad H_1:\mu_1\not=\mu_2 $$

を考えます。

(つまり、帰無仮説では母平均の差はない \( \mu_1-\mu_2=0 \) と仮定するわけです)

このとき、それぞれの正規母集団から抽出した標本 \( X_1,\cdots,X_m \) と \( Y_1,\cdots,Y_n \) に対して、

$$ \overline{X}=\frac{1}{m}\sum_{i=1}^mX_i, \quad \overline{Y}=\frac{1}{n}\sum_{i=1}^nY_i $$

$$ S_1^2=\frac{1}{m-1}\sum_{i=1}^m(X_i-\overline{X})^2, \quad S_2^2=\frac{1}{n-1}\sum_{i=1}^n(Y_i-\overline{Y})^2 $$

$$ \hat{\sigma}^2=\frac{(m-1)S_1^2+(n-1)S^2_2}{(m-1)+(n-1)}=\frac{\sum_{i=1}^m(X_i-\overline{X})^2+\sum_{i=1}^n(Y_i-\overline{Y})^2}{m+n-2} $$

とおくと、確率・統計20の定理4より、

$$ \begin{align} 0.95&=P\left( (\overline{X}-\overline{Y})-t_{0.025}(m+n-2)\sqrt{\hat{\sigma}^2\left(\frac{1}{m}+\frac{1}{n}\right)}≦\mu_1-\mu_2 \right. \\ &\left. \quad \quad \quad \quad ≦(\overline{X}-\overline{Y})+t_{0.025}(m+n-2)\sqrt{\hat{\sigma}^2\left(\frac{1}{m}+\frac{1}{n}\right)} \right) \\ &=P\left( -t_{0.025}(m+n-2)≦\frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{\sqrt{\hat{\sigma}^2\left(\frac{1}{m}+\frac{1}{n}\right)}}≦t_{0.025}(m+n-2) \right) \\ \end{align} $$

となります。したがって、帰無仮説 \( H_0:\mu_1=\mu_2 \) が成り立つので、

$$ T=\frac{\overline{X}-\overline{Y}}{\sqrt{\hat{\sigma}^2\left(\frac{1}{m}+\frac{1}{n}\right)}} $$

とおくと、有意水準 \( 0.05 \) の両側検定の棄却域 \( R \) は

$$ \begin{align} 0.05&=1-0.95=1-P\left( -t_{0.025}(m+n-2)≦T≦t_{0.025}(m+n-2) \right) \\ &=P(\{ T<-t_{0.025}(m+n-2)\}\cup\{ T>t_{0.025}(m+n-2)\}) \end{align} $$

より、

$$ R=\{ T<-t_{0.025}(m+n-2)\}\cup\{ T>t_{0.025}(m+n-2)\} $$

となります。同様に有意水準 \( 0.01 \) の両側検定の棄却域 \( R \) は

$$ R=\{ T<-t_{0.005}(m+n-2)\}\cup\{ T>t_{0.005}(m+n-2)\} $$

まとめると、

定理5 (分散未知で小標本で等分散の場合における2つの正規母集団の母平均の差の両側仮説検定)

2つの母集団がそれぞれ正規分布 \( N(\mu_1,\sigma_1^2),N(\mu_2,\sigma^2_2) \) に従っていて、母分散 \( \sigma_1^2,\sigma^2_2 \) がわかっていないが等しい \( \sigma^2_1=\sigma^2_2=\sigma^2 \) とする。

また、2つの正規母集団から抽出した(十分大ではない)標本をそれぞれ \( X_1,\cdots,X_m \) と \( Y_1,\cdots,Y_n \) として、

$$ \overline{X}=\frac{1}{m}\sum_{i=1}^mX_i, \quad \overline{Y}=\frac{1}{n}\sum_{i=1}^nY_i $$

$$ S_1^2=\frac{1}{m-1}\sum_{i=1}^m(X_i-\overline{X})^2, \quad S_2^2=\frac{1}{n-1}\sum_{i=1}^n(Y_i-\overline{Y})^2 $$

$$ \hat{\sigma}^2=\frac{(m-1)S_1^2+(n-1)S^2_2}{(m-1)+(n-1)}=\frac{\sum_{i=1}^m(X_i-\overline{X})^2+\sum_{i=1}^n(Y_i-\overline{Y})^2}{m+n-2} $$

とおく。

仮説 \( H_0:\mu_1=\mu_2, \quad H_1:\mu_1\not=\mu_2 \) に対して、有意水準 \( 0.05,0.01 \) の母平均の差 \( \mu_1-\mu_2 \) の両側検定の棄却域 \( R \) は次のようになる。

検定統計量を

$$ T=\frac{\overline{X}-\overline{Y}}{\sqrt{\hat{\sigma}^2\left(\frac{1}{m}+\frac{1}{n}\right)}} $$

とするとき、

$$ 有意水準0.05 \quad R=\{ T<-t_{0.025}(m+n-2)\}\cup\{ T>t_{0.025}(m+n-2)\} $$

$$ 有意水準0.01 \quad R=\{ T<-t_{0.005}(m+n-2)\}\cup\{ T>t_{0.005}(m+n-2)\} $$

同様に片側検定の場合は次のようになります。

定理6 (分散未知で小標本で等分散の場合における2つの正規母集団の母平均の差の片側仮説検定)

2つの母集団がそれぞれ正規分布 \( N(\mu_1,\sigma_1^2),N(\mu_2,\sigma^2_2) \) に従っていて、母分散 \( \sigma_1^2,\sigma^2_2 \) がわかっていないが等しい \( \sigma^2_1=\sigma^2_2=\sigma^2 \) とする。

また、2つの正規母集団から抽出した(十分大ではない)標本をそれぞれ \( X_1,\cdots,X_m \) と \( Y_1,\cdots,Y_n \) として、

$$ \overline{X}=\frac{1}{m}\sum_{i=1}^mX_i, \quad \overline{Y}=\frac{1}{n}\sum_{i=1}^nY_i $$

$$ S_1^2=\frac{1}{m-1}\sum_{i=1}^m(X_i-\overline{X})^2, \quad S_2^2=\frac{1}{n-1}\sum_{i=1}^n(Y_i-\overline{Y})^2 $$

$$ \hat{\sigma}^2=\frac{(m-1)S_1^2+(n-1)S^2_2}{(m-1)+(n-1)}=\frac{\sum_{i=1}^m(X_i-\overline{X})^2+\sum_{i=1}^n(Y_i-\overline{Y})^2}{m+n-2} $$

とおく。

仮説 \( H_0:\mu_1=\mu_2, \quad H_1:\mu_1<(>)\mu_2 \) に対して、有意水準 \( 0.05,0.01 \) の母平均の差 \( \mu_1-\mu_2 \) の片側検定の棄却域 \( R \) は次のようになる。

検定統計量を

$$ T=\frac{\overline{X}-\overline{Y}}{\sqrt{\hat{\sigma}^2\left(\frac{1}{m}+\frac{1}{n}\right)}} $$

とするとき、

$$ 有意水準0.05 \quad R=\{ T<-t_{0.05}(m+n-2)\} \ (\{T>t_{0.05}(m+n-2)\}) $$

$$ 有意水準0.01 \quad R=\{ T<-t_{0.01}(m+n-2) \}\ (\{ T>t_{0.01}(m+n-2)\}) $$

例2

学校 \( A \) から8人、学校 \( B \) から10人選んで、数学のテストの点数を調べたら次のようになった。

$$ 学校A : 30, \ 44, \ 50, \ 71, \ 43, \ 40, \ 61, \ 52 $$

$$ 学校B : 68, \ 40, \ 44, \ 53, \ 26, \ 22, \ 36, \ 59, \ 60, \ 66 $$

このとき、2つの学校の点数の平均は等しいといえるかを有意水準 \( 0.05 \) で検定する。

ただし、2つの学校の点数の分散は等しいとしてよい。(理由は例5)

まず、帰無仮説を \( H_0:\mu_1=\mu_2 \) とおき、対立仮説を \( H_1:\mu_1\not=\mu_2 \) とおく。

また、有意水準は \( 0.05 \) である。

帰無仮説 \( H_0 \) が正しいとすると、検定統計量

$$ T=\frac{\overline{X}-\overline{Y}}{\sqrt{\hat{\sigma}^2\left(\frac{1}{8}+\frac{1}{10}\right)}} $$

は自由度 \( 16 \) の \( t \) 分布 \( t(16) \) に従う。

このとき、定理5より有意水準 \( 0.05 \) の棄却域 \( R \) は

$$ \begin{align} R&=\{ T<-t_{0.025}(16)\}\cup\{ T>t_{0.025}(16)\} \\ &=\{ T<-2.12\}\cup\{ T>2.12\} \end{align} $$

となる。したがって、

$$ \overline{X}=48.875, \quad \overline{Y}=47.4, \quad \hat{\sigma}^2≒220.044 $$

より、検定統計量 \( T \) の実現値 \( T^* \) が

$$ T^*=\frac{48.875-47.4}{\sqrt{220.044\times \left(\frac{1}{8}+\frac{1}{10}\right)}}≒0.209\not\in R $$

となるので、帰無仮説 \( H_0 \) は受容される。

よって、2つの学校の点数の平均は等しくないとはいいきれない。

(2つの学校の点数の平均は等しいとまではいえないことに注意)

標本数が少なく母分散が未知で等分散でもない場合

次に、母分散 \( \sigma_1^2,\sigma^2_2 \) が未知で標本数 \( m,n \) が少なく、等分散でもない場合における2つの正規母集団の母平均の差 \( \mu_1-\mu_2 \) の仮説検定を考えていきましょう。

初めに、両側検定

$$ H_0:\mu_1=\mu_2, \quad H_1:\mu_1\not=\mu_2 $$

を考えます。

(つまり、帰無仮説では母平均の差はない \( \mu_1-\mu_2=0 \) と仮定するわけです)

このとき、それぞれの正規母集団から抽出した標本 \( X_1,\cdots,X_m \) と \( Y_1,\cdots,Y_n \) に対して、

$$ \overline{X}=\frac{1}{m}\sum_{i=1}^mX_i, \quad \overline{Y}=\frac{1}{n}\sum_{i=1}^nY_i $$

$$ S_1^2=\frac{1}{m-1}\sum_{i=1}^m(X_i-\overline{X})^2, \quad S_2^2=\frac{1}{n-1}\sum_{i=1}^n(Y_i-\overline{Y})^2 $$

とおくと、確率・統計20の定理6より、

$$ \begin{align} 0.95&=P\left( (\overline{x}-\overline{y})-t_{0.025}(\phi^*)\sqrt{\frac{S_1^2}{m}+\frac{S_2^2}{n}}≦\mu_1-\mu_2 \right. \\ &\left. \quad \quad \quad \quad ≦(\overline{x}-\overline{y})+t_{0.025}(\phi^*)\sqrt{\frac{S_1^2}{m}+\frac{S_2^2}{n}} \right) \\ &=P\left( -t_{0.025}(\phi^*)≦\frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{S_1^2}{m}+\frac{S_2^2}{n}}}≦t_{0.025}(\phi^*) \right) \\ \end{align} $$

ここで、

$$ \phi^*=\frac{\left( \frac{S_1^2}{m}+\frac{S_2^2}{n} \right)^2}{\frac{1}{m-1}\left( \frac{S_1^2}{m}\right)^2+\frac{1}{n-1}\left( \frac{S_2^2}{n} \right)^2} $$

したがって、帰無仮説 \( H_0:\mu_1=\mu_2 \) が成り立つので、

$$ T=\frac{\overline{X}-\overline{Y}}{\sqrt{\frac{S_1^2}{m}+\frac{S_2^2}{n}}} $$

とおくと、有意水準 \( 0.05 \) の両側検定の棄却域 \( R \) は

$$ \begin{align} 0.05&=1-0.95=1-P\left( -t_{0.025}(\phi^*)≦T≦t_{0.025}(\phi^*) \right) \\ &=P(\{ T<-t_{0.025}(\phi^*)\}\cup\{ T>t_{0.025}(\phi^*)\}) \end{align} $$

より、

$$ R=\{ T<-t_{0.025}(\phi^*)\}\cup\{ T>t_{0.025}(\phi^*)\} $$

となります。同様に有意水準 \( 0.01 \) の両側検定の棄却域 \( R \) は

$$ R=\{ T<-t_{0.005}(\phi^*)\}\cup\{ T>t_{0.005}(\phi^*)\} $$

この検定のことをウェルチの検定ともよばれます。

まとめると、

定理7 (分散未知で小標本で等分散でない場合における2つの正規母集団の母平均の差の両側仮説検定)

2つの母集団がそれぞれ正規分布 \( N(\mu_1,\sigma_1^2),N(\mu_2,\sigma^2_2) \) に従っていて、母分散 \( \sigma_1^2,\sigma^2_2 \) がわかっておらず等しくない \( \sigma^2_1\not=\sigma^2_2 \) とする。

また、2つの正規母集団から抽出した(十分大ではない)標本をそれぞれ \( X_1,\cdots,X_m \) と \( Y_1,\cdots,Y_n \) として、

$$ \overline{X}=\frac{1}{m}\sum_{i=1}^mX_i, \quad \overline{Y}=\frac{1}{n}\sum_{i=1}^nY_i $$

$$ S_1^2=\frac{1}{m-1}\sum_{i=1}^m(X_i-\overline{X})^2, \quad S_2^2=\frac{1}{n-1}\sum_{i=1}^n(Y_i-\overline{Y})^2 $$

とおく。

仮説 \( H_0:\mu_1=\mu_2, \quad H_1:\mu_1\not=\mu_2 \) に対して、有意水準 \( 0.05,0.01 \) の母平均の差 \( \mu_1-\mu_2 \) の両側検定の棄却域 \( R \) は次のようになる。

$$ T=\frac{\overline{X}-\overline{Y}}{\sqrt{\frac{S_1^2}{m}+\frac{S_2^2}{n}}} $$

とするとき、

$$ 有意水準0.05 \quad R=\{ T<-t_{0.025}(\phi^*)\}\cup\{ T>t_{0.025}(\phi^*)\} $$

$$ 有意水準0.01 \quad R=\{ T<-t_{0.005}(\phi^*)\}\cup\{ T>t_{0.005}(\phi^*)\} $$

ここで、

$$ \phi^*=\frac{\left( \frac{S_1^2}{m}+\frac{S_2^2}{n} \right)^2}{\frac{1}{m-1}\left( \frac{S_1^2}{m}\right)^2+\frac{1}{n-1}\left( \frac{S_2^2}{n} \right)^2} $$

同様に片側検定の場合は次のようになります。

定理8 (分散未知で小標本で等分散でない場合における2つの正規母集団の母平均の差の片側仮説検定)

2つの母集団がそれぞれ正規分布 \( N(\mu_1,\sigma_1^2),N(\mu_2,\sigma^2_2) \) に従っていて、母分散 \( \sigma_1^2,\sigma^2_2 \) がわかっておらず等しくない \( \sigma^2_1\not=\sigma^2_2 \) とする。

また、2つの正規母集団から抽出した(十分大ではない)標本をそれぞれ \( X_1,\cdots,X_m \) と \( Y_1,\cdots,Y_n \) として、

$$ \overline{X}=\frac{1}{m}\sum_{i=1}^mX_i, \quad \overline{Y}=\frac{1}{n}\sum_{i=1}^nY_i $$

$$ S_1^2=\frac{1}{m-1}\sum_{i=1}^m(X_i-\overline{X})^2, \quad S_2^2=\frac{1}{n-1}\sum_{i=1}^n(Y_i-\overline{Y})^2 $$

とおく。

仮説 \( H_0:\mu_1=\mu_2, \quad H_1:\mu_1<(>)\mu_2 \) に対して、有意水準 \( 0.05,0.01 \) の母平均の差 \( \mu_1-\mu_2 \) の片側検定の棄却域 \( R \) は次のようになる。

検定統計量を

$$ T=\frac{\overline{X}-\overline{Y}}{\sqrt{\hat{\sigma}^2\left(\frac{1}{m}+\frac{1}{n}\right)}} $$

とするとき、

$$ 有意水準0.05 \quad R=\{ T<-t_{0.05}(\phi^*)\} \ (\{T>t_{0.05}(\phi^*)\}) $$

$$ 有意水準0.01 \quad R=\{ T<-t_{0.01}(\phi^*) \}\ (\{ T>t_{0.01}(\phi^*)\}) $$

ここで、

$$ \phi^*=\frac{\left( \frac{S_1^2}{m}+\frac{S_2^2}{n} \right)^2}{\frac{1}{m-1}\left( \frac{S_1^2}{m}\right)^2+\frac{1}{n-1}\left( \frac{S_2^2}{n} \right)^2} $$

例3

学校 \( A \) から8人、学校 \( B \) から10人選んで、数学のテストの点数を調べたら次のようになった。

$$ 学校A : 30, \ 44, \ 50, \ 71, \ 43, \ 40, \ 61, \ 52 $$

$$ 学校B : 91, \ 68, \ 10, \ 54, \ 32, \ 54, \ 89, \ 61, \ 32, \ 59 $$

このとき、2つの学校の点数の平均は等しいといえるかを有意水準 \( 0.05 \) で検定する。

ただし、2つの学校の点数の分散は等しくないとする。

まず、帰無仮説を \( H_0:\mu_1=\mu_2 \) とおき、対立仮説を \( H_1:\mu_1\not=\mu_2 \) とおく。

また、有意水準は \( 0.05 \) である。

帰無仮説 \( H_0 \) が正しいとすると、検定統計量

$$ T=\frac{\overline{X}-\overline{Y}}{\sqrt{\frac{S_1^2}{8}+\frac{S_2^2}{10}}} $$

は自由度 \( \phi^* \) の \( t \) 分布 \( t(\phi^*) \) に従う。

このとき、定理7より有意水準 \( 0.05 \) の棄却域 \( R \) は

$$ \begin{align} R&=\{ T<-t_{0.025}(\phi^*)\}\cup\{ T>t_{0.025}(\phi^*)\} \end{align} $$

となる。したがって、

$$ \overline{X}=48.875, \quad \overline{Y}=55 $$

$$ S_1^2≒162.982, \quad S_2^2≒639.778 $$

$$ \phi^*≒14 $$

より、有意水準 \( 0.05 \) の棄却域 \( R \) は

$$ \begin{align} R&=\{ T<-t_{0.025}(14)\}\cup\{ T>t_{0.025}(14)\} \\ &=\{ T<-2.145\}\cup\{ T>2.145\} \end{align} $$

となり、検定統計量 \( T \) の実現値 \( T^* \) が

$$ T^*=\frac{48.875-55}{\sqrt{\frac{162.982}{8}+\frac{639.778}{10}}}≒-0.667\not\in R $$

となるので、帰無仮説 \( H_0 \) は受容される。

よって、2つの学校の点数の平均は等しくないとはいいきれない。

(2つの学校の点数の平均は等しいとまではいえないことに注意)

対応ある2標本の場合

次に、対応ある2標本の場合に対して2つの正規母集団の母平均の差 \( \mu_1-\mu_2 \) の仮説検定を考えていきましょう。

ここでは、母分散が未知で小標本の場合を考えます。(ほかの場合も同様)

初めに、両側検定

$$ H_0:\mu_1=\mu_2, \quad H_1:\mu_1\not=\mu_2 $$

を考えます。

(つまり、帰無仮説では母平均の差はない \( \mu_1-\mu_2=0 \) と仮定するわけです)

このとき、それぞれの正規母集団から抽出した対応ある2標本 \( X_1,\cdots,X_n \) と \( Y_1,\cdots,Y_n \) に対して、

$$ Z_i=X_i-Y_i $$

$$ \overline{Z}=\frac{1}{n}\sum_{i=1}^nZ_i, \quad S^2=\frac{1}{n-1}\sum_{i=1}^n(Z_i-\overline{Z})^2 $$

とおくと、確率・統計18の定理3より、

$$ \begin{align} 0.95&=P\left( -t_{0.025}(n-1)≦\frac{\sqrt{n}(\overline{Z}-(\mu_1-\mu_2))}{S}≦t_{0.025}(n-1) \right) \\ &=P\left( \overline{Z}-t_{0.025}(n-1)\frac{S}{\sqrt{n}}≦\mu_1-\mu_2≦\overline{Z}+t_{0.025}(n-1)\frac{S}{\sqrt{n}} \right) \end{align} $$

となります。したがって、帰無仮説 \( H_0:\mu_1=\mu_2 \) が成り立つので、

$$ T=\frac{\sqrt{n}\overline{Z}}{S} $$

とおくと、有意水準 \( 0.05 \) の両側検定の棄却域 \( R \) は

$$ \begin{align} 0.05&=1-0.95=1-P\left( -t_{0.025}(n-1)≦T≦t_{0.025}(n-1) \right) \\ &=P(\{ T<-t_{0.025}(n-1)\}\cup\{ T>t_{0.025}(n-1)\}) \end{align} $$

より、

$$ R=\{ T<-t_{0.025}(n-1)\}\cup\{ T>t_{0.025}(n-1)\} $$

となります。同様に有意水準 \( 0.01 \) の両側検定の棄却域 \( R \) は

$$ R=\{ T<-t_{0.005}(n-1)\}\cup\{ T>t_{0.005}(n-1)\} $$

まとめると、

定理9 (対応ある2標本の場合における2つの正規母集団の母平均の差の両側仮説検定)

2つの対応ある母集団がそれぞれ正規分布 \( N(\mu_1,\sigma_1^2),N(\mu_2,\sigma^2_2) \) に従っていて、母分散 \( \sigma_1^2,\sigma^2_2 \) がわかっていないとする。

また、2つの正規母集団から抽出した(十分大ではない)対応ある2標本をそれぞれ \( X_1,\cdots,X_n \) と \( Y_1,\cdots,Y_n \) として、

$$ Z_i=X_i-Y_i $$

$$ \overline{Z}=\frac{1}{n}\sum_{i=1}^nZ_i, \quad S^2=\frac{1}{n-1}\sum_{i=1}^n(Z_i-\overline{Z})^2 $$

とおく。

仮説 \( H_0:\mu_1=\mu_2, \quad H_1:\mu_1\not=\mu_2 \) に対して、有意水準 \( 0.05,0.01 \) の母平均の差 \( \mu_1-\mu_2 \) の両側検定の棄却域 \( R \) は次のようになる。

$$ T=\frac{\sqrt{n}\overline{Z}}{S} $$

とするとき、

$$ 有意水準0.05 \quad R=\{ T<-t_{0.025}(n-1)\}\cup\{ T>t_{0.025}(n-1)\} $$

$$ 有意水準0.01 \quad R=\{ T<-t_{0.005}(n-1)\}\cup\{ T>t_{0.005}(n-1)\} $$

同様に片側検定の場合は次のようになります。

定理10 (対応ある2標本の場合における2つの正規母集団の母平均の差の片側仮説検定)

2つの対応ある母集団がそれぞれ正規分布 \( N(\mu_1,\sigma_1^2),N(\mu_2,\sigma^2_2) \) に従っていて、母分散 \( \sigma_1^2,\sigma^2_2 \) がわかっていないとする。

また、2つの正規母集団から抽出した(十分大ではない)対応ある2標本をそれぞれ \( X_1,\cdots,X_n \) と \( Y_1,\cdots,Y_n \) として、

$$ Z_i=X_i-Y_i $$

$$ \overline{Z}=\frac{1}{n}\sum_{i=1}^nZ_i, \quad S^2=\frac{1}{n-1}\sum_{i=1}^n(Z_i-\overline{Z})^2 $$

とおく。

仮説 \( H_0:\mu_1=\mu_2, \quad H_1:\mu_1<(>)\mu_2 \) に対して、有意水準 \( 0.05,0.01 \) の母平均の差 \( \mu_1-\mu_2 \) の片側検定の棄却域 \( R \) は次のようになる。

検定統計量を

$$ T=\frac{\sqrt{n}\overline{Z}}{S} $$

とするとき、

$$ 有意水準0.05 \quad R=\{ T<-t_{0.05}(n-1)\} \ (\{T>t_{0.05}(n-1)\}) $$

$$ 有意水準0.01 \quad R=\{ T<-t_{0.01}(n-1) \}\ (\{ T>t_{0.01}(n-1)\}) $$

例4

8人に対して、あるダイエットを行う前後の体重を測ったところ次のようであった。

$$ ダイエット前: 74, \ 86, \ 76, \ 82, \ 78, \ 85, \ 79, \ 71 \ (kg) $$

$$ ダイエット後: 70, \ 85, \ 70, \ 80, \ 71, \ 81, \ 69, \ 79 \ (kg) $$

このとき、このダイエットは有効であるといえるかを有意水準 \( 0.05 \) で検定する。

まず、帰無仮説を \( H_0:\mu_1=\mu_2 \) とおき、対立仮説を \( H_1:\mu_1\not=\mu_2 \) とおく。

また、有意水準は \( 0.05 \) である。

帰無仮説 \( H_0 \) が正しいとすると、検定統計量

$$ T=\frac{\sqrt{8}\overline{Z}}{S} $$

は自由度 \( 7 \) の \( t \) 分布 \( t(7) \) に従う。

このとき、定理9より有意水準 \( 0.05 \) の棄却域 \( R \) は

$$ \begin{align} R&=\{ T<-t_{0.025}(7)\}\cup\{ T>t_{0.025}(7)\} \\ &=\{ T<-2.365\}\cup\{ T>2.365\} \end{align} $$

となる。したがって、

$$ \overline{Z}=3.25, \quad S^2=28.79 $$

より、検定統計量 \( T \) の実現値 \( T^* \) が

$$ T^*=\frac{\sqrt{8}\times 3.25}{\sqrt{28.79}}≒1.713\not\in R $$

となるので、帰無仮説 \( H_0 \) は受容される。

よって、このダイエットは有効であるとはいいきれない。

(このダイエットは有効でないとまではいえないことに注意)

2つの正規母集団の母分散の比の仮説検定(等分散仮説の検定)

2つの正規母集団の母分散の比 \( \frac{\sigma_2^2}{\sigma^2_1} \) の仮説検定を考えていきましょう。

(母分散は非負の値をとるので、差をとるのはあまり好ましくありません。)

初めに、両側検定

$$ H_0:\sigma^2_1=\sigma^2_2, \quad H_1:\sigma^2_1\not=\sigma^2_2 $$

を考えます。(等分散仮説の検定という風にも考えられます)

(つまり、帰無仮説では母分散の比は1である \( \frac{\sigma_2^2}{\sigma^2_1}=1 \) と仮定するわけです)

このとき、それぞれの正規母集団から抽出した標本 \( X_1,\cdots,X_m \) と \( Y_1,\cdots,Y_n \) に対して、

$$ \overline{X}=\frac{1}{m}\sum_{i=1}^mX_i, \quad S_1^2=\frac{1}{m-1}\sum_{i=1}^n(X_i-\overline{X})^2 $$

$$ \overline{Y}=\frac{1}{n}\sum_{i=1}^nY_i, \quad S_2^2=\frac{1}{n-1}\sum_{i=1}^n(Y_i-\overline{Y})^2 $$

とおくと、確率・統計20の定理7より、

$$ \begin{align} 0.95&=P\left( F_{1-0.025}(m-1,n-1)\frac{S_2^2}{S_1^2}≦\frac{\sigma_2^2}{\sigma^2_1}≦F_{0.025}(m-1,n-1)\frac{S_2^2}{S_1^2} \right) \\ &=P\left( F_{1-0.025}(m-1,n-1)≦\frac{S_1^2}{\sigma_1^2}\cdot \frac{\sigma^2_2}{S_2^2}≦F_{0.025}(m-1,n-1) \right) \end{align} $$

となります。

したがって、帰無仮説 \( H_0:\sigma^2_1=\sigma^2_2 \) が成り立つので、

$$ T=\frac{S_1^2}{S_2^2} $$

とおくと、有意水準 \( 0.05 \) の両側検定の棄却域 \( R \) は

$$ \begin{align} 0.05&=1-0.95=1-P\left( F_{1-0.025}(m-1,n-1)≦T≦F_{0.025}(m-1,n-1) \right) \\ &=P(\{ T<F_{1-0.025}(m-1,n-1)\}\cup\{ T>F_{0.025}(m-1,n-1)\}) \end{align} $$

より、

$$ R=\{ T<F_{1-0.025}(m-1,n-1)\}\cup\{ T>F_{0.025}(m-1,n-1)\} $$

となります。同様に有意水準 \( 0.01 \) の両側検定の棄却域 \( R \) は

$$ R=\{ T<F_{1-0.005}(m-1,n-1)\}\cup\{ T>F_{0.005}(m-1,n-1)\} $$

まとめると、

定理11 (2つの正規母集団の母分散の比の両側仮説検定)

2つの母集団がそれぞれ正規分布 \( N(\mu_1,\sigma_1^2),N(\mu_2,\sigma^2_2) \) に従っていて、母平均 \( \mu_1,\mu_2 \) がわかっていないとする。

また、2つの正規母集団から抽出した標本をそれぞれ \( X_1,\cdots,X_m \) と \( Y_1,\cdots,Y_n \) として、

$$ \overline{X}=\frac{1}{m}\sum_{i=1}^mX_i, \quad S_1^2=\frac{1}{m-1}\sum_{i=1}^n(X_i-\overline{X})^2 $$

$$ \overline{Y}=\frac{1}{n}\sum_{i=1}^nY_i, \quad S_2^2=\frac{1}{n-1}\sum_{i=1}^n(Y_i-\overline{Y})^2 $$

とおく。

仮説 \( H_0:\sigma^2_1=\sigma^2_2, \quad H_1:\sigma^2_1\not=\sigma^2_2 \) に対して、有意水準 \( 0.05,0.01 \) の母分散の比 \( \frac{\sigma_2^2}{\sigma^2_1} \) の両側検定の棄却域 \( R \) は次のようになる。

$$ T=\frac{S_1^2}{S_2^2} $$

とするとき、

$$ 有意水準0.05 \quad R=\{ T<F_{1-0.025}(m-1,n-1)\}\cup\{ T>F_{0.025}(m-1,n-1)\} $$

$$ 有意水準0.01 \quad R=\{ T<F_{1-0.005}(m-1,n-1)\}\cup\{ T>F_{0.005}(m-1,n-1)\} $$

同様に片側検定の場合は次のようになります。

定理12 (2つの正規母集団の母分散の比の片側仮説検定)

2つの母集団がそれぞれ正規分布 \( N(\mu_1,\sigma_1^2),N(\mu_2,\sigma^2_2) \) に従っていて、母平均 \( \mu_1,\mu_2 \) がわかっていないとする。

また、2つの正規母集団から抽出した標本をそれぞれ \( X_1,\cdots,X_m \) と \( Y_1,\cdots,Y_n \) として、

$$ \overline{X}=\frac{1}{m}\sum_{i=1}^mX_i, \quad S_1^2=\frac{1}{m-1}\sum_{i=1}^n(X_i-\overline{X})^2 $$

$$ \overline{Y}=\frac{1}{n}\sum_{i=1}^nY_i, \quad S_2^2=\frac{1}{n-1}\sum_{i=1}^n(Y_i-\overline{Y})^2 $$

とおく。

仮説 \( H_0:\sigma^2_1=\sigma^2_2, \quad H_1:\sigma^2_1<(>)\sigma^2_2 \) に対して、有意水準 \( 0.05,0.01 \) の母分散の比 \( \frac{\sigma_2^2}{\sigma^2_1} \) の片側検定の棄却域 \( R \) は次のようになる。

検定統計量を

$$ T=\frac{S_1^2}{S_2^2} $$

とするとき、

$$ 有意水準0.05 \quad R=\{ T<F_{1-0.05}(m-1,n-1)\} \ (\{T>F_{0.05}(m-1,n-1)\}) $$

$$ 有意水準0.01 \quad R=\{ T<F_{1-0.005}(m-1,n-1) \}\ (\{ T>F_{0.005}(m-1,n-1)\}) $$

例5

例2と同じ状況を考える。

学校 \( A \) から8人、学校 \( B \) から10人選んで、数学のテストの点数を調べたら次のようになった。

$$ 学校A : 30, \ 44, \ 50, \ 71, \ 43, \ 40, \ 61, \ 52 $$

$$ 学校B : 68, \ 40, \ 44, \ 53, \ 26, \ 22, \ 36, \ 59, \ 60, \ 66 $$

このとき、2つの学校の点数の分散は等しいといえるかを有意水準 \( 0.05 \) で検定する。

まず、帰無仮説を \( H_0:\sigma^2_1=\sigma^2_2 \) とおき、対立仮説を \( H_1:\sigma^2_1\not=\sigma^2_2 \) とおく。

また、有意水準は \( 0.05 \) である。

帰無仮説 \( H_0 \) が正しいとすると、検定統計量

$$ T=\frac{S_1^2}{S_2^2} $$

は自由度 \( (7,9) \) の \( F \) 分布 \( F(7,9) \) に従う。

このとき、定理11より有意水準 \( 0.05 \) の棄却域 \( R \) は

$$ \begin{align} R&=\{ T<F_{1-0.025}(7,9)\}\cup\{ T>F_{0.025}(7,9)\} \\ &=\{ T<0.207 \}\cup\{ T>4.197\} \end{align} $$

となる。したがって、

$$ \overline{X}=48.875, \quad \overline{Y}=47.4, \quad S_1^2≒162.982, \quad S_2^2≒266.044 $$

より、検定統計量 \( T \) の実現値 \( T^* \) が

$$ T^*=\frac{162.982}{266.044}≒0.613\not\in R $$

となるので、帰無仮説 \( H_0 \) は受容される。

よって、2つの学校の点数の分散は等しくないとはいいきれない。

(したがって、例2で等分散であるとしてよい)

2つの母比率の差の仮説検定

2つの母比率の差 \( p_1-p_2 \) の仮説検定を考えていきましょう。

ここでは2つの母集団の要素は十分大きいとします

すると、ある特性の母比率が \( p_1,p_2 \) の2つの母集団から抽出した(十分多い)標本 \( X_1,\cdots,X_m \) 、 \( Y_1,\cdots, Y_n \) の中でその特性をもっている標本の個数をそれぞれ \( X,Y \) とおくと、 \( X,Y \) は二項分布 \( B(m,p_1),B(n,p_2) \) に従います。

初めに、両側検定

$$ H_0:p_1=p_2, \quad H_1:p_1\not=p_2 $$

を考えます。

(つまり、帰無仮説では母比率の差はない \( p_1-p_2=0 \) と仮定するわけです)

このとき、

$$ \hat{p}_1=\frac{X}{m}, \quad \hat{p}_2=\frac{Y}{n} $$

とおくと、確率・統計20の定理9より、

$$ \begin{align} 0.95&=P\left( (\hat{p}_1-\hat{p}_2)-1.96\sqrt{\frac{\hat{p}_1(1-\hat{p}_1)}{m}+\frac{\hat{p}_2(1-\hat{p}_2)}{n}}≦p_1-p_2 \right. \\ &\left. \quad \quad \quad \quad≦(\hat{p}_1-\hat{p}_2)+1.96\sqrt{\frac{\hat{p}_1(1-\hat{p}_1)}{m}+\frac{\hat{p}_2(1-\hat{p}_2)}{n}} \right) \\ &=P\left( -1.96≦\frac{(\hat{p}_1-\hat{p}_2)-(p_1-p_2)}{\sqrt{\frac{\hat{p}_1(1-\hat{p}_1)}{m}+\frac{\hat{p}_2(1-\hat{p}_2)}{n}}}≦1.96 \right) \end{align} $$

となります。したがって、帰無仮説 \( H_0:p_1=p_2 \) が成り立つので、

$$ T=\frac{\hat{p}_1-\hat{p}_2}{\sqrt{\frac{\hat{p}_1(1-\hat{p}_1)}{m}+\frac{\hat{p}_2(1-\hat{p}_2)}{n}}} $$

とおくと、有意水準 \( 0.05 \) の両側検定の棄却域 \( R \) は

$$ \begin{align} 0.05&=1-0.95=1-P\left( -1.96≦T≦1.96 \right) \\ &=P(\{ T<-1.96\}\cup\{ T>1.96\}) \end{align} $$

より、

$$ R=\{ T<-1.96\}\cup\{ T>1.96\} $$

となります。同様に有意水準 \( 0.01 \) の両側検定の棄却域 \( R \) は

$$ R=\{ T<-2.58\}\cup\{ T>2.58\} $$

まとめると、

定理13 (2つの母比率の差の両側仮説検定)

ある特性の母比率が \( p_1,p_2 \) の2つの母集団からそれぞれ \( m,n \) 個標本を抽出して、その特性をもっている標本の個数をそれぞれ \( X,Y \) とおく。

ただし、標本数 \( m,n \) は十分大きいとする。

このとき、

$$ \hat{p}_1=\frac{X}{m}, \quad \hat{p}_2=\frac{Y}{n} $$

とおく。

仮説 \( H_0:p_1=p_2, \quad H_1:p_1\not=p_2 \) に対して、有意水準 \( 0.05,0.01 \) の母比率の差 \( p_1-p_2 \) の両側検定の棄却域 \( R \) は次のようになる。

$$ T=\frac{\hat{p}_1-\hat{p}_2}{\sqrt{\frac{\hat{p}_1(1-\hat{p}_1)}{m}+\frac{\hat{p}_2(1-\hat{p}_2)}{n}}} $$

とするとき、

$$ 有意水準0.05 \quad R=\{ T<-1.96\}\cup\{ T>1.96\} $$

$$ 有意水準0.01 \quad R=\{ T<-2.58\}\cup\{ T>2.58\} $$

同様に片側検定の場合は次のようになります。

定理14 (2つの母比率の差の片側仮説検定)

ある特性の母比率が \( p_1,p_2 \) の2つの母集団からそれぞれ \( m,n \) 個標本を抽出して、その特性をもっている標本の個数をそれぞれ \( X,Y \) とおく。

ただし、標本数 \( m,n \) は十分大きいとする。

このとき、

$$ \hat{p}_1=\frac{X}{m}, \quad \hat{p}_2=\frac{Y}{n} $$

とおく。

仮説 \( H_0:p_1=p_2, \quad H_1:p_1<(>)p_2 \) に対して、有意水準 \( 0.05,0.01 \) の母比率の差 \( p_1-p_2 \) の片側検定の棄却域 \( R \) は次のようになる。

検定統計量を

$$ T=\frac{\hat{p}_1-\hat{p}_2}{\sqrt{\frac{\hat{p}_1(1-\hat{p}_1)}{m}+\frac{\hat{p}_2(1-\hat{p}_2)}{n}}} $$

とするとき、

$$ 有意水準0.05 \quad R=\{ T<-1.645\} \ (\{T>1.645\}) $$

$$ 有意水準0.01 \quad R=\{ T<-2.33 \}\ (\{ T>2.33\}) $$

例6

\( A \) 市から100人、 \( B \) 市から150人を無作為に選んである政党を支持しているかどうかを調査したところ、支持者はそれぞれ35人と30人であった。

このとき、2つの市で支持率に差があるといえるかを有意水準 \( 0.05 \) で検定する。

まず、帰無仮説を \( H_0:p_1=p_2 \) とおき、対立仮説を \( H_1:p_1\not=p_2 \) とおく。

また、有意水準は \( 0.05 \) である。

$$ \hat{p}_1=\frac{X}{100}, \quad \hat{p}_2=\frac{Y}{150} $$

とおいて、帰無仮説 \( H_0 \) が正しいとすると、検定統計量

$$ T=\frac{\hat{p}_1-\hat{p}_2}{\sqrt{\frac{\hat{p}_1(1-\hat{p}_1)}{100}+\frac{\hat{p}_2(1-\hat{p}_2)}{150}}} $$

は標準正規分布 \( N(0,1) \) に従う。

このとき、定理13より有意水準 \( 0.05 \) の棄却域 \( R \) は

$$ \begin{align} R&=\{ T<-1.96\}\cup\{ T>1.96\} \end{align} $$

となる。したがって、

$$ X=35, \quad Y=30 $$

より、検定統計量 \( T \) の実現値 \( T^* \) が

$$ T^*=\frac{\frac{35}{100}-\frac{30}{150}}{\sqrt{\frac{\frac{35}{100}(1-\frac{35}{100})}{100}+\frac{\frac{30}{150}(1-\frac{30}{150})}{150}}}=2.649\in R $$

となるので、帰無仮説 \( H_0 \) は棄却される。

よって、2つの市で支持率に差があるといえる。

今回はここまでです。お疲れ様でした。また次回にお会いしましょう。

目次