質問<29>98/7/17
from=Akira Onaga
「確率についての質問」


翁長(おなが)@那覇です.ご無沙汰しております.
確率の質問ですが,これは高校生の娘に教えるためではなく私自身必要なのにわから
ないのです.よろしくお願いします.
Fisherの直接確率を計算する途中で出てくるのですが,
事象A,Bがあって,AでないをA*,BでないをB*で表します.
n回の試行を行って,AかつB=a回,AかつB*=b回,A*かつB=c回,A*かつB*=d回出る(田の
字型になっているるわけです.当然a+b+c+d=n)確率は
{(a+b)!・(c+d)!・(a+c)!・(b+d)!}/{a!・b!・c!・d!・n!}
であると書いてあります.
この確率の前提は何で,またこの式はどうやって導かれるのでしょう.
A対A*,B対B*それぞれ確率0.5とすると,上記の確率は
n!/{(2の2n乗)・a!・b!・c!・d!}になるように思うのですが.


お返事98/7/19
from=武田


日頃扱ってない内容なので、参考書を読んでみましたが、半分理解できて、残り半分は
分からないままです。なお、読んだ本は下記の2冊です。

  佐藤 信著「推計学のすすめ…決定と計画の科学」講談社BLUE BACKSシリーズ
  守谷栄一著「詳解演習 数理統計」オーム社書店 日本理工出版会

事象AとBが独立しているかどうか検定するためχ2検定を行います。
帰無仮説として、A,Bが独立している(影響しあってない)と仮定を立てます。
A,Bの属性がAがL個、BがM個考えられるときは、L×M分割表が作られ、そ
の個々の度数nijを調べて、次の統計量χ02を計算して判定します。
その計算式は、次のようです。
χ02=Σ[(nij-ni..j/n)2/(ni..j/n)]
  =n[Σ(nij2/(ni..j)-1]

このLとMは共に2個の場合が多いので、2元分割表がよく使われます。例えば、
A\BB*
a+b
A*c+d
a+cb+d
とすると、統計量χ02は変形して、 χ02 n(ad-bc)2      (a+b)(c+d)(a+c)(b+d) となります。 この式を使って、多くの問題を解くわけですが、具体例を一つやってみましょう。  (例)男性用化粧品を使用している150名の内、既婚者は60名で独身者は     90名であった。使用していない100名の中で既婚者は60名で独身     者は40名であった。独身者が特に男性用化粧品を使用していると言え     るか。
A\B使用   使用しない
既婚者6060120
独身者9040130
150100250
    χ02 250(60*40-60*90)2          120*130*150*100       =9.615     自由度はφ=(L-1)×(M-1)=(2-1)×(2-1)=1     有意水準α=0.05(5%)     として、χ2分布表より、境界値を読みとると、         χ2(1,0.05)=3.84     したがって、         χ02>χ2(1,0.05)     境界値をオーバーしているので、帰無仮説(AとBは独立している)     は棄却されることになる。つまり、AとBは影響している。言葉を換     えると、独身者は化粧品を使用していることが多い。 さて、質問の件に入りますが、(やっと出てきて申し訳ない…) 度数nijの一つが、5より小さいときに限り、R.A.フィッシャーの 考えた直接計算法が使われるようです。 次の分割表の時の計算式は、質問の式になります。
A\BB*
a+b
A*c+d
a+cb+d
確率p=(a+b)!(c+d)!(a+c)!(b+d)!       n!a!b!c!d! ただ、この確率の式がどこから導かれたかは、上記の参考書には書いてありません でした。もっと詳しいR.A.Fisherの専門書を見れば書いてあるでしょう。 さらに、確率が0.5のときの式については全く分かりません。 せめて、その変形をお知らせ下さい。

お便り98/7/23
from=kyukusu


P(A)=p , P(B)=qとするとき表のような周辺度数が現れる(X)確率は
P(X)=nCa+bpa+b(1-p)c+d*nCa+cqa+c(1-q)b+d
={(n!)2/(a+b)!(c+d)!(a+c)!(b+d)!} *pa+b(1-p)c+dqa+c(1-q)b+d

一方a,b,c,dの度数が現れる確率(Y)は
P(Y)=nCa+bpa+b(1-p)c+d*a+bCaqa(1-q)b*c+dCcqc(1-q)b+d
={n!/a!b!c!d!}*pa+b(1-p)c+dqa+c(1-q)b+d

よって周辺度数が表の条件の下でa,b,c,dの表値が得られる確率は(条件付き確率で)
Px(Y)=P(Y)/P(X)={(a+b)!(c+d)!(a+c)!(b+d)!}/n!}*1/a!b!c!d!
………
というのがサイエンス社の統計入門(和田秀三著)に載っていました.宜しく