ひとりマーケティングのためのデータ分析
SPILL

TOOLS / STATISTICS

データの分布が正規性を満たしているか「視覚的」に判定する、
ExcelでのQ-Qプロットのつくり方。

パーセンタイル順位をz値に変換し、直線に乗るか散布図で確認する。

2026/4/26

晴花

HARUKA

データが正規分布にしたがっているか——ヒストグラムで見る方法もあるけど、Q-Q プロットの方が尾の部分のずれを捉えやすい。マーカーが直線に乗るかどうかで判断する。

Q-Q プロット(正規確率プロット)とは

データが正規分布などの理論分布にしたがっているかどうかを目視で確認するためのグラフです。期待が満たされるなら、プロットされたマーカーは一定の勾配をもつ直線状に並びます。

このページでは統計処理系「R」(qqnorm() 関数)に準じた形式を採用します。横軸に標準正規分布の分位点、縦軸に観測値をとります。

SPILL MODE

Excel 365 / 2021 以降で使える「自動展開(スピル)」式に切り替えます。

01

元データ

今回の元データは、ぶ厚い事典の中ほどのページをめがけて最初から指を滑らせながらぴったり止めようと 1000 回試行した結果です(ページ数を用紙の枚数に換算)。

このデータの分布をヒストグラムで可視化し、正規分布曲線(赤線)と重ねてみると、正規分布にしたがっていることがわかります。このページでは同様のことを Q-Q プロットでおこないます。

元データ
元データ・正規確率プロット
ヒストグラムで正規性を見る
元データの分布(ヒストグラム+正規分布曲線)
02

ここにいう「Q-Q プロット」について

Q-Q プロットには横軸・縦軸が異なるさまざまな書式があります(cf. Google 画像検索 )。このページでは「R」に準じた形式——横軸に標準正規分布の分位点、縦軸に観測値——を採用します。

1 のデータをもとに R で Q-Q プロットを出力(qqnorm() 関数)すると図のようになります(グレーの囲み文字を除く)。

Rによる正規確率プロット—横軸:標準正規分布のパーセンタイル, 縦軸:観測値

シートに見出しを 2 つ用意します。識別できれば何でも構いません。ここでは %順位Normsinv(%順位) とします。

見出しを2つ用意

グラフ描画に必要なのは「観測値」列と「Normsinv(%順位)」列の 2 つですが、後者をダイレクトに求めると式が長くなるため、過程を 2 ステップに分割します。

観測値→相対化して順位付け→理論分布にあてはめる

R に準じて「Normsinv(%順位)」列を散布図の横軸に、「観測値」列を縦軸に充てます。

観測値:縦軸, Normsinv(%順位):横軸
03

パーセンタイル順位に置き換える

「%順位」列に観測値の昇順での百分率順位を求めます。見出し直下のセルに下式を入力し、最下行までコピーします。

  • D2=((RANK.EQ(C2,$C$2:$C$1001,1)+COUNTIF($C$2:C2,C2)-1)-1/2)/$A$2
%順位の計算式を入力

式の構造を説明します。青緑色のアンダーライン線部分は並びの順位を計算する要素です。これを「順位」と置き換えると (順位$-1/2$)/$n$ という式になります。

[数式の構造] =(順位-0.5)/n

R に準じてここでは $(順位-1/2)/n$ を採用します。この定義に縛りがない場合は下記の諸式も利用されます($i$:順位)。

  1. $(i-0.375)\,/\,(n+0.25)$
  2. $(i-0.3)\,/\,(n+0.4)$
  3. $i\,/\,(n+1)$
  4. $i\,/\,n$

[表の出所] 17.2.4 Probability Plot and Q-Q Plot — "OriginLab" を一部改変

Excel 固有の PercentRank 系関数も利用できますが、Q-Q プロットが視覚的な判断をおこなうものである以上、どれが優れるかという議論は馴染みがたいように感じます。

再度青緑色のアンダーライン線部の式について。Excel の Rank.Eq は同値の場合に同順位(欠番あり)で処理します。R に準じる趣旨ではこれは意に沿わないため、CountIf 関数で前方の同値を検出し、後の値を下位とする処置を加えています(欠番なし)。

晴花

「%順位」の計算式は (順位 $-1/2$) / $n$ が核心。RANK.EQ 単独では同値に欠番が生じるため、COUNTIF で前方の同値を検出して順位をずらす工夫が必要。

RANK.EQのみ:欠番あり / RANK.EQ+COUNTIF:欠番なし
04

その下側確率なら、z 分布はどの値を返す?

「Normsinv(%順位)」列に次の式を入力し、最下行までコピーします。

  • E2=NORM.S.INV(D2)
[セルE2]=NORM.S.INV(D2)

見出し「Normsinv(%順位)」の直下に次の式を入力します(スピルで一括展開)。

  • E2=NORM.S.INV(D2:D1001)
[セルE2]=NORM.S.INV(D2:D1001)
05

「散布図」にプロットして あてはまりを判断する

グラフを描画する前に、列の位置関係を整えます。Excel では左側の列が横軸に割り振られるため、このままでは意図と異なる体裁になります。E 列(Normsinv)を切り取り(図上段)、C 列の位置に切り取ったセルの挿入(図下段)します。

切り取りって
「Normsinv(%順位)」列を切り取って…
列を移動
「観測値」列の上で挿入

「Normsinv(%順位)」および「観測値」列を選択し、挿入 タブ → グラフ グループの 散布図 (X, Y) またはバブルチャートの挿入散布図 とクリックします。

散布図を作成

縦軸のラベルがグラフ中央に配置されました。Q-Q プロットとしては左側の方が自然なので、第 1 縦軸 を選択して書式設定ウィンドウを呼び出し、ラベルの位置下端/左端 に変更します。

縦軸ラベル位置の変更

$n$ がある程度の大きさになると、50 パーセンタイル(横軸 0)周辺は正規分布の性質上密度が濃くなり、塗りつぶしマーカーでは 1 本の線のように見えてしまいます。R に倣いマーカーの塗り色を抜くのがベターです。"系列 1" をアクティブにした状態で 系列のオプションマーカー グループ → 塗りつぶし塗りつぶしなし に変更します。

マーカーの塗り色を削除

任意にその他の書式設定を加えます。最低限やっておくべき項目として——

  • 横・縦両軸の 境界値最小値最大値)の設定
  • プロットエリアの縦横比の調整(正方に)

Q-Q プロットの完成です。

Q-Qプロット(完成)

晴花