2026/5/29
統計は「知る」より「見る」ほうが早い
大数の法則、中心極限定理、信頼区間——統計学の入門書には必ず登場するこれらの概念は、 文章で読んでも数式を追っても、どこか実感が伴わないことが多いです。 「理屈はわかった気がするが、本当にそうなるのか?」という感覚が残る。
このページで紹介する3つのシミュレーターは、その「実感」を補うために作りました。 パラメータを動かし、グラフが変化するのを見ながら、 統計の根本にある論理を直感として身につけることを目的としています。
3つの概念は、一本の糸でつながっている
この3つのシミュレーターが扱う概念は、バラバラに存在しているわけではありません。 大数の法則を土台として中心極限定理が成り立ち、 中心極限定理があるからこそ信頼区間の計算が可能になる——という論理的な連鎖があります。
STEP 01 — 土台
大数の法則
試行を繰り返すほど、標本の平均は母平均に収束する。「たくさん測れば真実に近づく」という統計的推測の大前提。
STEP 02 — 発展
中心極限定理
母集団の形がどれだけ歪んでいても、標本サイズを大きくすると標本平均の分布は正規分布に近づく。これが「正規分布を使っていい理由」の根拠。
STEP 03 — 実務への接続
信頼区間
標本平均の分布が正規分布に従うからこそ、「母平均がどの範囲にありそうか」を確率的に語れる。アンケートや実験結果の解釈に直結する概念。
HARUKA
統計の教科書がこれらを別々の章で扱うため、独立した知識として記憶しようとする人が多い。 しかし本質的には一つの問いへの答えだ——「有限の標本から、無限の母集団について何が言えるか」という問いへの。 その答えの構造を理解してから個々の概念に戻ると、見え方が変わる。
大数の法則シミュレーター:「最初の数十回」がいかに当てにならないか
「試行回数を増やすほど、標本の平均は真の確率(母平均)に収束する」—— 大数の法則は文章にすれば一行ですが、その「収束の速さ」と「最初のブレの大きさ」は、 実際に動かして見るまで実感しにくいです。
このシミュレーターでは、さいころやコイン投げだけでなく、 クリック率(CTR)や不良品率といった実務に近いモデルでも試せます。 希少事象——確率が低いもの——ほど収束が遅く、 最初の数百回程度では真の値からかなり離れた推定になることがグラフで確認できます。
AYAKO
「先月のCTRが低かったのは施策が悪かったから」って判断、早まってない? クリック率が低い広告って、そもそも大数の法則的にサンプルがたまりにくいから、 ちょっとやそっとの試行じゃ本当の実力が見えてこないんですよ。 このシミュレーターで「何回くらいから信用できるか」を感覚として掴んでおくといいです!
中心極限定理シミュレーター:歪んだ分布が正規分布に「変身」する瞬間
中心極限定理が不思議なのは、母集団の形を問わないという点です。 U字型のベータ分布でも、極端に右に歪んだカイ二乗分布でも、 標本サイズ n を大きくしていくと標本平均の分布は正規分布に近づいていきます。
このシミュレーターでは、母集団の分布を切り替えながら、 n を増やすにつれてヒストグラムが正規曲線に重なっていく過程をリアルタイムで確認できます。 「正規分布を前提としていいのか?」という問いへの答えが、ここにあります。
HARUKA
実務で統計を使う人間が中心極限定理を知っておくべき理由は一つ。 「このデータは正規分布していないから t 検定は使えない」という誤解が蔓延しているから。 検定が前提とするのは母集団の正規性ではなく、標本平均の正規性の方。 そして後者は、中心極限定理によってほぼ保証される。
SIMULATOR 02 中心極限定理シミュレーター 形がどんなに歪んでいても、平均は正規に向かう。 シミュレーターを開く
信頼区間シミュレーター:「95%」は区間の中身ではなく手順の信頼性
MISCONCEPTION — よくある誤解
「95%信頼区間」とは、この区間の中に母平均が95%の確率で入っている、ということだ。
正しくは:同じ手順で信頼区間を繰り返し構築すると、そのうち95%の区間が母平均を含む。95%とは区間の中身ではなく、手順の信頼性を表している。
この違いは、文章で読んでも腑に落ちにくいです。 しかし実際に100本の信頼区間を並べて描画し、 そのうち何本が母平均(真の値)をまたいでいるかを目で確認すると、一瞬で理解が変わります。
AYAKO
アンケート結果に「95%信頼区間:42%〜58%」って書いてあったとき、 「母平均が42〜58%の範囲に95%の確率でいる」って読んじゃってた! シミュレーターを動かしてみたら、「区間のほうが動いていて、母平均は動かない」 ってことがやっと体感できました。概念の向きが逆だったんですね。
推奨する使い方:概念の順番に沿って動かす
3つのシミュレーターはどれから始めても使えますが、 統計を初めて体系的に学ぶ方や、学び直しをしたい方には 大数の法則 → 中心極限定理 → 信頼区間の順に触れることをお勧めします。 概念の論理的な積み重ねと一致しているからです。
一方、実務での使い方として最も多いのは「信頼区間から逆引きする」パターンです。 「アンケート結果の解釈に自信が持てない」という方はまず信頼区間シミュレーターから触れ、 疑問が出てきたときに中心極限定理・大数の法則へ遡るという使い方も有効です。
HARUKA
シミュレーターはあくまで直感を養う道具。 「なぜそうなるのか」の数学的な背景を理解したい場合は、 各シミュレーターのページに参考文献を掲載しているのでそちらを参照してほしい。 直感と理論は車の両輪で、どちらかだけでは実務に使える統計知識にはなりにくい。