手順解説 | Excel(エクセル)でおこなうビジネスデータの分析

ツール[13.2] 母比率の検定

How-to 母比率の検定

ここでは比較的おおきな1標本を対象とした検定を扱います。この検定では、ある比較値とある標本の比率との '差' が、統計的に意味のあるものなのかどうかを確認します。

具体的には、(1)帰無仮説と対立仮説を立てる、(2)標本から検定統計量を求める、(3)帰無仮説の下での結果の起きやすさ[確率]を求める、(4)仮説を判定する …といった手順でおこないます。

以下、エクセルによる母比率の検定の手続きです(z検定)。ここでは一連の手続きを Excel2010 で追っています。これは Excel2013 でも変わりません。また Excel2007 については使用する関数が異なる箇所があります。この場合には、当該箇所に併記しています。

翔太

OSS社から依頼の調査の一部に、母平均の検定についてのタスク 'task C' があります。

これは「サービス認知度」に関する調査です(n=300)。具体的には、顧客が定義するパラメータと合致した企業および団体に対し「オフィス向けに据え置き菓子を提供するサービスの業態」の存在がどの程度認知されているかを確認するものです。

taskC)ある地域の一定の条件に合うすべての会社と団体→300社を抽出し「オフィス向けに据え置き菓子を提供するサービスの業態」の認知度を調査

翔太

先輩の話によると、OSS社はおよそ3年前、同様の調査を他社でより大規模におこなっているようです。そのときの認知率[標本比率]は 22.0% であったとのことでした。…ここではこの値を 比較値(p0)として考えます。

taskC)過去の他社調査データ:認知率22.0%

翔太

下が今回の調査で集まったデータです。なお「区分」系列はカテゴリデータで、1 が「認知している」状態を、0 が「認知していない」状態をあらわしています。僕はこれらについて統計的に検定をおこなうよう先輩から指示を受けました両側, 有意水準5%。ワードについては別頁)。以下、このタスクに関する検定のプロセスです。


※データは左サイドバーのボタンからご利用いただけます。

元データ・母比率の検定

taskA z検定

翔太

では、ここから task C の検定のプロセスです。

最初に立てておいた仮説は次のとおりです。ここでは帰無仮説として「母比率は比較値と一致している」ことを立て、対立仮説としては「母比率は比較値と一致していない」ことを立てました(両側検定)。

帰無仮説H0:pc=p0 対立仮説H1:pc≠p0

翔太

帰無仮説は「このデータは認知率=p0とする母集団から抽出されたものである」ことを、対立仮説は「認知率=p0とする母集団から抽出されたものでない」ことを言っています。つまり帰無仮説が棄却されれば、3年前と現在の認知率の差は有意なものとしてとらえることができます。

翔太

ではここから検定統計量(標本平均の基準値[z値, 標準化変量])を計算します。式は次のとおりです(以下、検定統計量についてこのページでは一律 ' T ' であらわします)。

T=(p-p0)/(sqrt((p0(1-p0))/n))

翔太

Tを求めるため、必要なデータをシートに入力していきます。

まずは「データ数」(n)と「比較値」(p0:ここでは過去の認知率)です。

翔太

「認知している」状態に関して、「標本比率」(pバー)を求めます。ここではカテゴリ '1' のデータ数を集計し、総データ数で割って計算しています。

翔太

Tを計算します。ここでは分子と分母に分けて計算しています。

翔太

あらかじめ決めておいた有意水準を入力します。ここでは 先輩から 5% にするよう指示されていますので、0.05(5%)としています。

翔太

棄却限界値を求めます(ここでは右側のそれを求めています)。片側検定の場合の値も計算していますが、ここで両側検定を選択した以上あくまで参考のものです。


<両側の計算式>

ver.2010 or later=NORM.S.INV(1-E12/2)
ver.2007=NORMSINV(1-E12/2)

<片側の計算式>

ver.2010 or later=NORM.S.INV(1-E12)
ver.2007=NORMSINV(1-E12)

※標準正規分布のz値(パーセント点)と確率の求め方※

姉妹サイト「BDAstyle」にて解説しています。詳細が必要な場合正規分布の確率とパーセント点の計算 with Excel頁を参照してください。

翔太

棄却限界値は 1.96 となりました。下の図のように Tの値(6.69)は棄却域(淡い空色の線)にかかったので帰無仮説は棄却できます(対立仮説を採択します)。

両側検定の棄却限界値とT

翔太

基本的な仮説検定の手続きとしては以上で十分だと思いますが、ここではP値(有意確率)からもアプローチしてみたいと思います。

ここでは両側検定のP値は片側検定のP値を2倍して求めることとします。具体的には 下のシートのようにいったん片側のP値を求めて、両側ではその値を参照します。…もちろん直接計算してもOKです。


<片側の計算式>

ver.2010 or later=1-NORM.S.DIST(ABS(E10),TRUE)
ver.2007=1-NORMSDIST(ABS(E10))

翔太

P値は両側の場合 0.00000000002 とでました(片側は参考です。なお値が小さすぎるので通常は指数表記[2.23268E-11]で表示されることと思います)。

翔太

両側検定の場合、P値(0.000000002%)が有意水準(5%)より小さくなりました。したがって標本比率(pバー)と比較値(p0)との差 (16%)については、「帰無仮説の下ではめったに起きないことが起きた」結果のものと言うことができます。

よって帰無仮説を棄却し、「確率的に意味のある差であった」と判断します。

FINISHED

P<有意水準α→帰無仮説H0を棄却できる:「確率的に意味のある差であった」→対立仮説H1の採用

ストーリーへ戻る

※ 例示するデータはすべて架空のものです。人物の名称はもとより、特定の会社等で実際に観測されたデータおよび行動に根拠をおくものでもありません。

このページの先頭へ