動画視聴ノート: But what is the Central Limit Theorem? (3Blue1Brown)

動画

正規分布ガウス曲線やベルカーブとしても知られ、いたるところに現れる。ゴルトンボード (Galton board) 然り、整数が持つ素因数の数然り (Erdős–Kac の定理) 。これは中心極限定理に起因する。

正規分布確率密度関数 \frac{1}{\sigma\sqrt{2\pi}} \mathrm{e}^{-\frac{1}{2}(\frac{x - \mu}{\sigma})^2} という形をしている。これは標準正規分布  \frac{1}{\sqrt{2\pi}} \mathrm{e}^{-\frac{x^2}{2}} に平行移動とスケーリングを施したものである。

中心極限定理の主張は次の通り。ある確率変数  X があり、その平均および標準偏差がそれぞれ  \mu, \sigma であるとする。このとき変数  \frac{X_1 +\cdots+ X_N - N \mu}{\sigma\sqrt{N}} は標準正規分布に従う。この変数は「確率変数の値の和は平均から標準偏差いくつ分離れているか」を意味する。定理を厳密な数式で表現すると次の通り。

 \displaystyle \lim_{N \to \infty} P\left(a \lt \frac{X_1 +\cdots+ X_N - N \mu}{\sigma\sqrt{N}} \lt b\right)  \displaystyle = \int_a^b \frac{1}{\sqrt{2\pi}} \mathrm{e}^{-\frac{x^2}{2}} \mathrm{d}x

ただしこれは次の3つを前提とする。

  • すべての  X が互いに独立である
  • すべての  X は同一の分布から得られる
  •  X は有限の分散を持つ  (0 \lt V \lt ∞)

例題の回答例

動画の最後のほうに例題が出題される。6面サイコロを100個振ったときの値の合計 (TRPG でいうところの 100D6) が95%の確率で分布する範囲を求めよ、というものだ。動画の回答とは少しだけ違うやり方で解いてみた。動画でも触れられた「足せるのは標準偏差ではなく分散」および「68–95–99.7ルール」を利用する。

100D6の平均、分散、標準偏差をそれぞれ  \mu, V, \sigma とする。また、1D6の平均および分散をそれぞれ  \mu_1, V_1 とする。 \mu_1 = 3.5 であり、またおおよそ  V_1 \approx 3 である。このとき、

 \mu = 100\mu_1 = 350,
 V = 100V_1 \approx 300,
 \sigma = \sqrt{V} \approx 17

なので、求める範囲  \mathrm{Range}_{95\%} は、

 \mathrm{Range}_{95\%} = [\mu - 2\sigma, \mu + 2\sigma] = [316, 384]

である。

 V_1 \approx 3 は 3D6 の分布が平均 10.5, 標準偏差 3 の正規分布に近いことを覚えていればすぐに導ける……のだが、動画視聴中に一時停止して解いていたときには間違えて  V_1 \approx \sqrt{3} を用いてしまっていた (それは標準偏差の値だ) 。上記の回答は動画視聴後に修正したものである。