ひとりマーケティングのためのデータ分析

手順解説 | Excel(エクセル)でおこなうビジネスデータの分析

平均の差に意味はある?
How-to

母平均の検定

ここでは 1 標本を対象とした検定を扱います。この検定では、ある比較値とある標本の平均との “差” が、統計的に意味のあるものなのかどうかを確認します。

具体的に、これは

  1. 帰無仮説と対立仮説を立てる
  2. 標本から検定統計量を求める
  3. 帰無仮説の下での結果の起きやすさ[確率]を求める
  4. 仮説を判定する

といった手順でおこないます。

以下、エクセルによる母平均の検定の手続きです(z検定と t検定)。ここでは一連の手続きを Excel 2010 で追っています。これは Excel 2013, Excel 2016 でも変わりません。また Excel 2007 については使用する関数が異なる箇所があります。この場合には、当該箇所に併記しています。

タスクと元データ

翔太

1

母平均の検定について 2 つのタスクがあります。母集団については、ともに正規性を仮定しています。

'task A' は、リサーチサービス社の近域に本店所在地を置く会社の社長の平均年齢に関する調査、'task B' は、同じく近域で営業するラーメン店のランチセットの平均価格の調査です。

task A は 100 社を、task B は 10 店を、両者とも僕が無作為に抽出して調べました。

taskA)ある地域に本店所在地を置くすべての会社→100社を抽出しその社長の年齢を計算 taskB)ある地域で営業するランチセットのあるすべてのラーメン店→10店を抽出しその店舗の定番ランチの値段を記録

翔太

2

先輩の話によると、両タスクとも全数調査(とみなしていいような性格)の結果がすでに存在するようです。具体的には task A の平均が 58.2 歳, task B の平均が 750.0 円…だと伝えられています。これらを比較値(μ0)とします。

…ただし、どちらの task も母標準偏差(σ)は教えてもらえませんでした。したがって、ここでは母標準偏差を未知として話をすすめます

taskA)全数調査データ:平均年齢58.2歳 taskB)全数調査データ:平均価格750円

翔太

3

下が両タスクについて僕が集めたデータです。今回はこれらについて統計的に検定をおこなうよう先輩から指示を受けています両側, 有意水準 5%。ワードについては後述)。以下、両タスクに関する検定のプロセスです。


※ データはサイドバーのボタンからご利用いただけます。

元データ・母平均の検定(1標本検定)

z or t?

翔太

4

あ。その前に…

下の図は、標準正規分布曲線と、両タスクにおいて収集したデータ数(n)にもとづく自由度(n-1)で描いた t 分布曲線です。どっちのタスクも母標準偏差(σ)が未知ですので基本的には t 検定で問題ないと思いますが、下の図の task A のように自由度がある程度おおきな場合には両曲線が非常に近似することから(自由度 99 の図では z 曲線と t 曲線が重なっていて z 曲線が見えません)、ここではあえて標準正規分布をベースとした z 検定を選択してみたいと思います。

また task B については両曲線の近似を主張していくのも…ちょっと無理筋な気もするので、セオリー通り t 分布をベースとした t 検定をおこなうことにします。

標準正規分布曲線・t分布曲線と検定法の選択

task A

z検定

帰無仮説と対立仮説

翔太

5

では、ここから task A の検定のプロセスです。

一連の流れの上では、帰無仮説対立仮説が何よりも先んじて立てられます。ふつう、帰無仮説には「母集団の分布が異なることを訴えたい」とする検定の目的に鑑みて、採用されて欲しくない方の説を据えます。

ここでは帰無仮説として「母平均は比較値と一致している」ことを立て、対立仮説としては「母平均は比較値と一致していない」ことを立てました(両側検定)。

帰無仮説H0:μA=μ0 対立仮説H1:μA≠μ0

翔太

6

…言い換えると、帰無仮説は「僕のデータは平均をμ0とする母集団から抽出されたものである」ことを、対立仮説は「平均をμ0とする母集団から抽出されたものでない」ことを示しています。

翔太

7

あ!

ということは…今回のケースの場合、帰無仮説が棄却されるようでは「どこを偏ってデータをひっぱってきたんだ!」なんてことになってしまいますね…。標本の抽出でつまづいたとなると…ウチのリサーチャーのはしくれとして失格ですか。…う~ん、僕のデータはどうなっているのか心配です…。


その意味で今回は「棄却されたくない帰無仮説」という希な例かもしれません。

μ0の分布の母集団を代表する標本をつくることができたか

検定統計量

翔太

8

ここから検定統計量を計算します。検定統計量は、後述の棄却限界値と突き合せたり P値 を求めたり…といった検定においての重要な作業で必要となる、いうなれば根幹となる値です。

さて、この標本が本当に平均 μ0、標準偏差 σ の母集団から抽出されたものだったとしたら(つまり、“帰無仮説は正しい” と仮定するならば)、標本平均(xバー)は、中心極限定理より平均 μ0、標準偏差 σ/√n(「標準誤差」)の正規分布にしたがうことが予期できます。

転じれば、標本平均(xバー)を標準化したもの…つまり下式は z分布(標準正規分布)にしたがうことが明らかなので、この式を検定統計量として利用します。

あ、ええと…検定統計量については、以下では ' T ' であらわすことにします。

T=(x-μ0)/(σ/√n)

翔太

9

T を求めるため、必要なデータをシートに用意していきます。

まずは「データ数」(n)と「比較値」(μ0:ここでは全数調査の結果)です。

翔太

10

「標本平均」(xバー) および (母標準偏差(σ)が分からないので代わりに)「標本標準偏差」(s)を求めます※。前者はAverage関数 を、後者はStdev.p関数(バージョン 2007 の場合, Stdevp関数)を用います。


※ ただし、n の大きさの判断によっては不偏標準偏差(ここでは、分母が n-1 の標準偏差を指す)の方を選択すべきだろうな…と思うところではあります。n が大きくなれば 標本・不偏それぞれの標準偏差に大きな差が生じないのでここでは標本―を使っていますが、セオリー的には例外なくStdev.s関数(バージョン 2007 の場合, Stdev関数)を充てておいた方がいろんな意味で混乱を生まないかもしれません。

翔太

11

T を計算します。ここでは分子と分母に分けて計算しています。

くり返しですが、母標準偏差(σ)は未知ですので標本標準偏差(s)を用います。

有意水準

翔太

12

あらかじめ決めておいた有意水準を入力します。これは帰無仮説を正しいとする状況において、「めったに起きないことが起きた」と判断する “よりどころ” として使います。

今回、これは先輩から 5% にするよう指示されていますので、ここでは 0.05 としておきたいと思います。

両側検定

翔太

13

ええと…有意水準を「『めったに起きないことが起きた』と判断する “よりどころ”」とひと口で片づけてしまいましたが…実のところ これには 2 つの考え方がありまして…。

翔太

14

ひとつは、標準正規分布の両裾あわせた任意の値(先にいう「有意水準」;通常は 5% or 1%)を判断のよりどころとするもので、この場合の検定は両側検定と呼ばれます。このタスクでおこなう有意水準 5%の両側検定の場合、有意水準は下の図の淡い紫色の面積で示されます。また淡い空色の太線部分は棄却域と呼ばれます。

両側検定は、ここでの対立仮説のように「差がある」ことに関心を寄せる場合などに用います。

両側検定の有意水準と棄却域

棄却限界と棄却域

翔太

15

この横軸上の棄却域とその他の部分(採択域)との境界上に位置するオレンジ色のマーカー(確率変数z)を棄却限界値と呼びます。先に求めた T が、棄却限界値を上下どちらかに超えてくるようであれば棄却域に入ります(帰無仮説の棄却)。

ただし 標準正規分布は左右に対称ですから、T の絶対値(|T|)をとって右側だけで判断されることも少なくありません。

両側検定の棄却限界値

片側検定

翔太

16

参考までに、いまひとつの判断として片側検定があります。同じ有意水準 5% の片側検定の場合、有意水準(=淡い紫色の面積)と棄却域(=淡い空色の太線)、そして棄却限界値(=オレンジ色のマーカー)は下の図のように示されます。


片側検定は、高い低いなど「方向性」に関心を寄せる場合などで用いられます。したがって対立仮説は両側検定の場合と異なり、「μA>μ0」あるいは「μA<μ0」が立てられます。片側検定の場合、帰無仮説が棄却されると当然に結果の方向性を決めつけてしまう結論となるので、最初から母集団の間での大小関係が明白だと確信できるような場合などをのぞいては、利用にあたっては慎重な判断が必要かもしれません。

片側検定の棄却域と棄却限界値(左片側検定の場合)

P値

翔太

17

あと…とりわけ重要なワードとして、P値有意確率)というものがあります。

P値 とは 最初に挙げた帰無仮説が正しいとしたとき、同じく先に求めた T の絶対値(|T|)より大きな(極端な)値が求められる確率を指して言います。言い換えれば、この標本が比較値μ0と同じ分布の母集団から抽出されたものならば、xバーとμ0との差(1.18歳 over)は、同じ調査を繰り返したとして、いったいどの程度の確率で発生するものなのか…についてを示します。


…と、ことばで言ってもいまいちピンとこないところがあるやもしれません。ゆえにこれを図示させてもらおうと思います。

両側検定・片側検定それぞれの P値 を正規分布曲線に重ねると、これは下のように示すことができます。黄緑で彩色した部分がそれであって、言い換えれば |T| の外側の領域の面積が P値 です。

両側検定のP値

片側検定のP値

めったに起きないことが起きたのか?

翔太

18

検定においては、ここまでに登場した

  • T
  • 棄却限界値
  • P値
  • 有意水準

の各値を選択的に使って、「めったに起きないことが起きた」かどうかの判断をおこないます。とりわけ…

翔太

19

後ろの2者――P値有意水準の大小関係に注目すると、

  • 「この差を超える標本平均となる確率は帰無仮説の下で 5%(調査 20 回中 1 回)に満たない」→「レア!」→「そもそもこの帰無仮説が正しいならこんな結果が出るのはおかしくない?」→「帰無仮説は誤りだ」(帰無仮説の棄却

と判断するか、

  • 「この差を超える標本平均となる確率は帰無仮説の下で 5%(調査 20 回中 1 回)を超える」→「レアでもない」→「帰無仮説が誤りだと結論付けるには無理がある」(帰無仮説は棄却できない

と判断することになります。


以上のように、“この差を超える標本平均となる確率が有意水準を超えるか超えないか” を知ることが検定においてはカギとなります。この点を果たせられればよいわけですから、P値 と 有意水準 のペア(以下、「方法2」)以外にも、T棄却限界値 の比較においても検定は可能です(以下、「方法1」)。

何と何を照らし合わせる?[方法1]検定統計量Tと棄却限界値 [方法2]P値と有意水準

棄却限界値 or P値の計算

翔太

20

ただ、いずれの方法をとるにしろ、上の図で彩色した部分の値については、ここまでのプロセスでは いまだ求められてはいないものです。

方法 1 では 棄却限界値 が、方法 2 では P値 がそれですが、それぞれの値は、具体的には順に 有意水準, T の各値をもとに計算していくこととなります。

棄却限界値←有意水準の値から求める P値←検定統計量Tの値から求める

棄却限界値 によるアプローチ

翔太

21

では、以上をふまえて、残る計算をしたいと思いますが…ええと…


まずは、方法 1 をとった場合…にしたいと思います。

翔太

22

この場合には、棄却限界値を求めます(ここでは右側のそれを求めています)。片側検定の場合の値も計算していますが、ここで両側検定を選択した以上あくまで参考のものです。


<両側の計算式>

ver.2010 or later=NORM.S.INV(1-E13/2)
ver.2007=NORMSINV(1-E13/2)

<片側の計算式>

ver.2010 or later=NORM.S.INV(1-E13)
ver.2007=NORMSINV(1-E13)

標準正規分布の z値(パーセント点)と確率の求め方

姉妹サイト「BDAstyle」にて別途解説しています。詳細が必要な場合 正規分布の確率とパーセント点の計算 with Excel 頁を参照してください。

翔太

23

棄却限界値は 1.96 となりました。…ということで、下の図でみると T の値(-1.46)は棄却域(淡い空色の線)にかからなかったようです。

両側検定の棄却限界値とT

翔太

24

これによって「帰無仮説が誤りだと結論付けるには無理がある」こと、つまり帰無仮説が棄却できないことを示すに十分な理由ができました。したがって、この場合はさらに P値 を計算しなければならない理由もありません。


ただ Excel に限らず、PC 環境では P値 を簡単に求めることができるゆえんか、個人的には 1 の方法がとられるケースを目にすることは少ないように思います(それこそケースバイケースでしょうが…)。


ところで、この結果は…僕的にはひとまず歓迎できるものでした……。

|T|が1.46より極端な値に振れる確率は(具体的に何%かは言及しないけれど)5%より大きいことは確か

P値 によるアプローチ

翔太

25

つづいては…方法 2 の場合にふれていきたいと思います。

翔太

26

その前に…両側検定・片側検定それぞれの P値 の図を再掲すると…こんなカンジでした(黄緑の領域の面積)。

(再掲)両側検定のP値

(再掲)片側検定のP値

翔太

27

上の図から 両側検定の場合の P値 は、片側検定のそれの 2 つ分であることがわかります。ここでもそうした考え方にしたがって、前者の P値 は後者のそれを 2 倍して求めることにします。

具体的には 下のようにいったん片側の P値 を求めて、両側ではその値を参照します。…もちろん直接計算しても OK です。


片側の計算式>

ver.2010 or later=1-NORM.S.DIST(ABS(E11),TRUE)
ver.2007=1-NORMSDIST(ABS(E11))

翔太

28

P値 は両側で 0.14 とでました(片側は参考です)。ここで P値 と 有意水準 を図示すると次のようになります(黄緑[淡い紫と重複部分あり]の面積…P値, 淡い紫の面積…有意水準。同じく片側は参考です)。

両側検定のP値と有意水準

片側検定のP値と有意水準(左片側検定の場合)

結局、意味のある差であったのか?

翔太

29

両側検定の場合、上の図からも P値(14%)が 有意水準(5%)より大きいことがわかります。

よって帰無仮説を棄却せず、「確率的に意味のある差ではない」と判断します(だからと言って帰無仮説そのままに「一致する」とは考えません。あくまで対立仮説を採択するには “証拠不足” であったことのみ示せます)。


また、帰無仮説が棄却された場合には対立仮説を採択します。

FINISHED

P>有意水準α→帰無仮説H0を受容:「確率的に意味のある差ではない」

task B

t検定

翔太

1

では、ここから task B の検定プロセスです。

基本的には z検定 と背景は同じですので重なる説明は端折ります。


最初に帰無仮説と対立仮説を立てます。

ここでも帰無仮説として「母平均は比較値と一致している」ことを立て、対立仮説として「母平均は比較値と一致していない」ことを立てました。

帰無仮説H0:μB=μ0 対立仮説H1:μB≠μ0

翔太

2

母集団の正規性が仮定され、母標準偏差が未知であり、かつ n(データの数) が小さな task B のようなケースにおいては、下の標本平均(xバー)に関する標準化変量が自由度 n-1 の t 分布にしたがうことを利用して、これを検定統計量とします。

T=(x-μ0)/(s/√n-1)

翔太

3

T を求めるため、必要なデータをシートに用意していきます。

まずは「データ数」(n)と「比較値」(μ0)です。

翔太

4

「標本平均」(xバー)と「標本標準偏差」(s)を求めます。前者はAverage関数を、後者はStdev.p関数(バージョン 2007 の場合,Stdevp関数)を用います。

翔太

5

T を計算します。ここでは 分子 と 分母 に分けて計算しています。

翔太

6

有意水準を入力します。

こちらも 5% でおこなうよう指示されていますので 0.05(5%)としておきます。

翔太

7

棄却限界値を求めます(ここでは右側のそれを求めています)。片側検定の場合の値も計算していますが、ここで両側検定を選択した以上あくまで参考のものです。


<両側の計算式>

ver.2010 or later=T.INV.2T(E13,E2-1)
ver.2007=TINV(E13, E2-1)

<片側の計算式>

ver.2010 or later=T.INV(1-E13,E2-1)
ver.2007=TINV(2*E13,E2-1)

t 分布 の t 値(パーセント点)と確率の求め方

姉妹サイト「BDAstyle」にて別途解説しています。詳細が必要な場合 t分布の確率とパーセント点の計算 with Excel 頁を参照してください。

翔太

8

棄却限界値は 2.26 と返ってきました。下の図のように T の値(-2.67)は棄却域にかかったので帰無仮説は棄却できます…。

両側検定の棄却限界値とT

翔太

9

こちらでも P値 からもアプローチしておきたいと思います(TDIST 系の関数は引数で両側片側の指定ができるのでこちらでは両者とも関数を使って計算しますが、もちろん z検定 のときのように両側については片側 2 倍でも OK です)。


…P値 の計算式は以下の通りです。


<両側の計算式>

ver.2010 or later=T.DIST.2T(ABS(E11),E2-1)
ver.2007=TDIST(ABS(E11),E2-1,2)

<片側の計算式>

ver.2010 or later=T.DIST.RT(ABS(E11),E2-1)
ver.2007=TDIST(ABS(E11),E2-1,1)

翔太

10

P値 は 両側 の場合 0.026 となるようです…(片側は参考です)。

翔太

11

したがって P値(2.6%)が 有意水準(5%)より小さいことがわかります。すなわち標本平均(xバー)と比較値(μ0)との差 (100.0円)については、「帰無仮説の下ではめったに起きないことが起きた」結果のものと言うことができます。

よって帰無仮説を棄却し、対立仮説を採択します。


…こっちの結果は、僕的にはマズイですけど。

FINISHED

P<有意水準α→帰無仮説H0を棄却できる:「確率的に意味のある差であった」→対立仮説H1の採択

  • 本頁で使用したデータはすべて架空のものです。また特定の会社等に実在する人物名、および同場所で実際に観測されたデータ群などを根拠にしたものでもありません。
.

LastUpdate

2016.7.12

.
このページの先頭へ