質問<2997>2006/2/28
from=かおり
「2項分布の正規近似」


確率変数Xが2項分布B(12、1/2)に従うとき
P(X=k)(k=0~12)の値の1つ1つを正規近似
して、相対誤差を求めよ。

既に質問2370で回答されていますが、
相対誤差の求め方がわかりません。教えて下さい。

★希望★完全解答★

お便り2006/3/16
from=亀田馬志


ええと、相対誤差ですね。
最近、統計関係の本ばっかしこたま買いこんで結構なお金かかってるんですが(笑)、
それはさておき、「相対誤差」って項目探したんですが、無いんで大変焦りました(笑)。
そこでネットで調べてみたら、次の定義になっているようです。

         相対誤差=誤差/|真の値|

これは、実は統計(特に数理統計)と別段深い縁があるワケでもなくって、
例えば「計算機工学」であるとか、実際に何らかの「測定絡み」で重要な概念らしいです。
ちょっと安心しました(笑)。
(計算機工学等でも計算の答えがどれだけの誤差を含むのか、が小数点以下何桁もの
世界では重要であるので、こう言った概念が必要ならしいです。もちろん測定でも、
です。)
上の問題ですと、「二項分布の正規近似」が題意のようなので、

  相対誤差=(正規分布の値-二項分布の値)/|二項分布の値|

を、それぞれの確率変数Xに対して求めよ、と言うのが題意らしいです。
メンド臭いんで(笑)、Microsoft Excelに計算させてみましょう(笑)。手順を如何に
説明します。

①セルA1にX、セルB1にB(12,1/2)、セルC1にN(6,3)、セルD1に誤差、セルE1に
相対誤差、と入力する。これらは列の名前、つまりラベルである。
②セルA2~A14まで0~12までの数字を入力する。これらが確率変数Xを示す。
③セルB2に二項分布B(12,1/2)の数式を入力する。ExcelではBinomdist関数を用いる。
具体的な書式は、

               =binomdist(A2,12,1/2,false)

と=から入力する。確率変数Xの引数にはセルA2を指定している。その後、セルB2を
コピーして、セルB3~セルB14まで貼り付けると、Excelは確率変数Xの
二項分布B(12,1/2)の具体的な値を返してくれる。
④セルC2に正規分布N(6,3)び数式を入力する。ExcelではNormdist関数を用いる。
具体的な書式は、

             =normdist(A2,6,sqrt(3),false)

と=から入力する。確率変数Xの引数にはセルA2を指定している。その後、セルC2を
コピーして、セルC3~セルC14まで貼り付けると、Excelは確率変数Xの
正規分布分布N(6,3)の具体的な値を返してくれる。
なお、一般には、二項分布 Bin(n,p) に従う確率変数 X は,n が大きいとき,
q=1-pとすると、近似的に正規分布 N(np,npq) にしたがう。
上の問題の場合、二項分布でnp=6、npq=3なので、N(6,3)を採用している。しかし、
ExcelのNormdist関数の書式では引数は分散ではなくって標準偏差を指定する。npqは
分散なので、ルートを取って標準偏差を指定する必要性が生じる為、引数では
sqrt(3)とルートを取らせる命令をしている。
⑤近似が上手く行ってるかどうか、視覚的に確認してみる。(統計学では図での確認
が何よりも肝要!!!)
セルA1~セルC14の範囲をマウスで選択した後、「挿入」メニューから「グラフ」を選択
する。
「グラフウィザード1/4」と言うポップアップが出てくるので、「グラフの種類」では
「散布図」を選択、「形式」では「データポイントを平滑線でつないだマーカーなしの
散布図です。」を選択する。
そのまま完了ボタンを押せば、Microsoft Excelが二項分布と正規分布が重なった
グラフを出力してくれる。
両者の近似がキレイに行われている事を視覚的に確認しよう。
⑥誤差を計算する。セルD2に次のように入力する。

                        =C2-B2

これで「正規分布の値-二項分布の値」を計算する事が出来る。セルD2をコピーした後、
セルD3~D14まで貼り付ける。
⑦相対誤差を計算する。セルE2に次のように入力する。

                       =D2/abs(B2)

これで「誤差÷絶対値を取った二項分布の値」が計算できる。もっとも二項分布は必ず
正の値なので、本当は絶対値を取る(ABS関数)必然性は全然ないのだが一応定義に
従った。
セルE2をコピーしてセルE3~E14まで貼り付ける。
これで全部作業終了。

一応下に計算結果を載せておきます。確認してみて下さい。

X B(12,1/2) N(6,3) 誤差 相対誤差
0 0.0002441410.00057093 0.000326789 1.338527573
1 0.0029296880.003570994 0.000641306 0.21889922
2 0.0161132810.016004084-0.000109197-0.006776852
3 0.0537109380.051393443-0.002317494-0.043147529
4 0.1208496090.118255074-0.002594535-0.021469126
5 0.1933593750.194969656 0.001610281 0.008327916
6 0.2255859380.230329433 0.004743495 0.021027443
7 0.1933593750.194969656 0.001610281 0.008327916
8 0.1208496090.118255074-0.002594535-0.021469126
9 0.0537109380.051393443-0.002317494-0.043147529
100.0161132810.016004084-0.000109197-0.006776852
110.0029296880.003570994 0.000641306 0.21889922
120.0002441410.00057093 0.000326789 1.338527573