質問<3536>2007/4/16
from=JUN*2
「期待値」


次の問題についても、ご指導よろしくお願いします。

袋に3個の白球とn-3個の黒球が入っている。
これらn個の球を袋から1個ずつ取り出すとき白球がX回目にはじめて取り出されるとして、
Xの期待値を、つぎのそれぞれの場合について求めよ。
1.取り出した球をそのつど袋に戻す場合
2.取り出した球を袋に戻さない場合

★希望★完全解答★

お便り2007/6/8
from=cqzypx




お便り2007/6/8
from=亀田馬志


ちょいと基礎的な部分を確認して頂きたいんで、敢えて「クドく」解法をなぞってみましょうか。
まず、1問目、2問目共に題意は「期待値」です。
この「期待値」と言う言葉、日常用語としても結構使われているケースが多いんですが、と同時に誤解されて
いる部分も多いので、改めて定義を見てみます。
確率論的な「意味」はさておき、数式の定義としてみます。それは、期待値E(X)は
E(X)=Σx*f(x)・・・・・・①
として表される、と言うものです。ここでは確率もクソも関係無く、数式の字面のままで見て頂きたい。 つまり、数学用語で言うと、独立変数xとその関数f(x)の積の和を「期待値」と呼ぶ、と。 んで、取りあえず理解はそれでイイのです。特にこの計算で出てくる答えを、数学的には「加重平均」と呼びます。 従って、この問題は確率はさておき、「加重平均を求めよ」と言う問題なんですね。 そして、非常に重要な部分は、確率さえ関係無かったら①の数式を解く問題なんです。言い換えると、 「数列の和を求めよ」ないしは級数に付いての問題なんです。確率は表面上でしか関わってません。 と言うか「ネタ」なだけなのです。 まず、その「ネタ」の部分を見抜かないといけません。出題者の真意は別の部分にあるんですね。 と言うワケでトリックに引っかからないように、数学上では「級数」の問題、として扱っていきます。 >取り出した球をそのつど袋に戻す この条件で、f(x)を決定します。 直感的には、「3/nになるんじゃねえの?」と思うでしょう。それはそれで間違いないんですが、 一つ制限が付きます。それは、 >n個の球を袋から1個ずつ取り出すとき白球がX回目にはじめて取り出される と言う部分です。つまり、独立試行としてその場その場限りの確率を訊いているんじゃないんです。 ちょっと分かりづらいかもしれませんが、例えばこの実験を始めて、 1回目:白球が取り出される確率=3/n と言う理解は間違ってません。問題は実験の2回目からなんです。何故なら、仮に1回目に白球が取り出 されてしまったらそれで実験が終了になっちゃいます。以降の事柄を考えなくて済むようになっちゃう んです。 まだピンと来ませんか?つまり、こう言う事です。2回目の実験が行なわれる為には1回目の実験は白球が取り 出すのが失敗していなければならないと言うのが条件になるんです。つまり、2回目以降のx番目の実験を x-1番目までの実験の結果が左右するんです。 ちなみに、日本語で書くと、 2回目:白球が取り出される確率 =1回目に白球が取り出されない確率×2回目に白球が取り出される確率 3回目:白球が取り出される確率 =1回目に白球が取り出されない確率×2回目に白球が取り出されない確率×3回目に白球が取り出される確率 ・・・・・・・・・ となります。これがこの問題のポイントなんです。 さて、ここから上記の現象を数式化します。一般化、と言ってもいいかもしれません。各回で独立試行として 白球が取り出される確率を3/nとして、同じ条件で白球が取り出されない確率を1-3/nとすると、上記のx回目に 白玉が取り出される確率f(x)は f(x)=(3/n)*(1-3/n)^(x-1)・・・・・・② と記述出来ます。この数列を書けるかどうか、がまずは第一段階ですね。 ちなみに確率論的には上のようなf(x)は確率分布として解釈されます。が、ここでは深入りしません。 確率・統計的に上のf(x)で設定が正しいのかどうか、は実際は上のようなf(x)のあらゆるxに対しての総和を求 めてみて、それが1になれば確率分布とします。まあ、これは宿題にします。②の総和を求めてみて、 1になるのかどうか試してみてください。 ②式をデッチ上げられれば、あとは期待値の定義である①に従って計算するだけ、です。すなわち、②式を①式 に代入して、 E(X)=Σx*(3/n)*(1-3/n)^(x-1)……③(Σはx=0からx=∞までの和) を計算すればよい。まあ、③式書けたら部分点くらいは貰えるでしょうね。うん。多分(笑)。 あとは純粋な数学の仕事なんですが・・・・・・ところが、③式計算するのが結構大変なんですね。数列/級数の 公式見てみたんですが、
Σx*ar^x
型の簡便な公式が見つかりませんでした。ありゃまあ。 まあ、解けない問題が出る、とはあまり考えたく無いですし、一応このサイトへ来る問題は高校生 でも解ける前提だろうとは思います(思うだけで、実際は違ったりしますが・笑)。 そこで、ちょっとトリックを使います。③式はx=0からx=∞までの和、と言うことにしていますが、一応x=0 からx=kまでの和、としてみましょう。そして、そのkが∞へと近付いていく、と。 つまり、 E(X)=limΣx*(3/n)*(1-3/n)^(x-1)・・・・・・③'(Σはx=0からX=kまでの和、そしてk→∞の極限を取る) としてみます。③と③'は意味する内容は丸っきり同じなんですが、表現が違います。 そして、表現の違いが如何に見通しを変えるのか、分かる格好の材料になると思います。 もう一つトリックを導入します。今、p=3/nと置いて、q=1-3/nと置けば、③'式は以下のように書き換える事 が出来ます。 E(X)=limΣx*p*q^(x-1)・・・・・・③''(Σはx=0からx=kまでの和、そしてk→∞の極限を取る) そして、前提としてはp+q=1です。と言うことはpをqで書いても、qをpで表現する事も出来ますし、どっちを 選ぶか、と言うのは任意ではあるんですが、qには乗数が付いてるので展開するのがメンド臭い。よってp=1-q と表現して③''式を書き直して見ましょう。 E(X)=limΣx*(1-q)*q^(x-1)・・・・・・③'''(Σはx=0からx=kまでの和、そしてk→∞の極限を取る) こうなると、展開が可能になりますね。式を展開してみます。 E(X)=limΣ{x*q^(x-1)-x*q^x} =lim{Σx*q^(x-1)-Σx*q^x)}・・・・・・③''''(Σはx=0からx=kまでの和、そしてk→∞の極限 を取る) つまり、2項からなる級数の差、の式に変換できるのです。 だから何だ?と思うかもしれません(笑)。が、これは実は大きな手がかりで、バカ正直に内訳計算してみる事が 可能となったんですよ(笑)。まるで初めて数列習った時のようですねえ(笑)。あ、お願い、ワタシ初めてなの、 優しくしてね♪(謎) 第1項の内訳は以下のようになります。 Σx*q^(x-1)=1+2*q+3*q^2+・・・・・・・・・+k*q^(k-1) 第2項の内訳は以下のようになります。 Σx*q*x=q+2*q^2+3*q^3+・・・・・・・・・+k*q^k この二つをボーッと眺めていると・・・・・・なんか規則性が見えてきますね。つまり、③''''式を実際に実行 するに辺り、小学生的な引き算をすると、 1+2*q+3*q^2+4*q^3+・・・・・・+ k*q^(k-1) -| q+2*q^2+3*q^3+・・・・・・+(k-1)*q^(k-1)+k*q^k ---------------------------------------------------------------------------------------- 1+ q+ q^2+ q^3+・・・・・・+ q^(k-1)-k*q^k となるんです。あら、結構キレイになりましたね。ちょっと整理してみましょうか。 ③''''式はようするに、 lim{Σx*q^(x-1)-Σx*q^x}=lim{Σq^(x-1)-k*q^k}・・・・・・④(Σはx=1からx=kまでの和、 そしてk→∞の極限を取る) ここまで来ればだいぶラクですね。しかも④式の第1項を計算するのはハナクソです(笑)。 なんせ、第1項は初項1、公比qの等比数列の和に他なりません。従って、第1項に公式を適用すると、 E(X)=lim{(1-q^k)/(1-q)-k*q^k}・・・・・・⑤(k→∞の極限を取る) と簡略化されます。 あとはちょっと整理してみましょうか。 E(X)=lim[{1-(k+1)*q^k+k*q^(k+1)}/(1-q)]・・・・・・⑥(k→∞の極限を取る) ⑥式が収束すれば良し、発散すれば失敗、と言う事なんですが、結論から言うと期待通りに収束します。 少々直感的、そしてインチキなんですが、一般に収束/発散のスピードは
log x << xn << ex << x!<< xx
と言われています。すなわち、q<1である以上、例えばq^kの0への収束スピードの方が係数であるk+1の 発散スピードより速いんです。従って、分子のkが絡んだ項は全て0に収束します(※1)。 従って、 E(X)=1/(1-q) =1/p =n/3・・・・・・(n>3) と言うのが答えとなります。
※1:収束の部分をキチンと取り扱いたい、と言う場合はロピタルの定理を使えばイイと思います。 ロピタルの定理とは、f(x)/g(x)の型の極限値を調べる為の定理で、r=1/qとした場合、⑥式の分子の第2項、 第3項をf(k)/g(k)型の極限値の問題にすり替え、それによって、項別に極限値の問題に帰着させる事が出来る と思います。が、今回の問題は少々煩雑なんで、その辺りは工学の連中がやるように直感的方法論で 避けました。厳密に数学的にはどーだかちょっとアレですが、問題の程度から言うと、どの程度の解法 を求めているのか、ちょっと分からなかったから、です。 ※2:この問題で扱った確率分布は実は幾何分布と言うレッキとした名前があります。んで、正直言うと、 問題の解法の過程はともかくとして、結論は初めっから分かってたのです(笑)。ズルい、と言われればそれま でなんですが(笑)、そう言った事はままあります(笑)。特に統計学の連中は証明はさておき結果を運用す る立場の人間が圧倒的に多いので、証明なんてあまり考えません。ところで、幾何分布での期待値を通常求 める場合、この解法の様に期待値の定義に従って数列をマジメに計算すると言う事は殆どあり得ません。 実は数学的トリックがあって、確率分布からモーメント母関数と呼ばれるモノを設定してそれの1階微分 が期待値になるんです。その証明法が圧倒的に多い。ただし、後続の問題との兼ね合いを考えて、敢えて数列の 問題に帰着させました。もう一つの理由が、モーメント母関数を導入すると、(高校)数学の問題と言うより、 圧倒的に確率・統計の理論の側面が際立ってしまう、と言う事。また、モーメント母関数自体が良く分からな い性質のモノである、って事が上げられます。一般に、確率分布をモーメント母関数として変換して、その 1階微分が期待値、2階微分が分散・・・・・・と、微分する事によって意味があるものが出てくるんです が、一般にn階微分が何を表しているのか、と言うとコレが全くの謎なんです。通常5階微分以上はしませんが、 5階微分より先の微分係数が何を意味しているのか確率/統計学的にはいまだ分かっていません。その辺り、 計算には便利なんですが、あまりにも曖昧模糊としているのがモーメント母関数の正体なんで、深入り したくなかった、と言う部分があるのです。
>2.取り出した球を袋に戻さない場合 さ~てと。これがまた難問ですねェ(笑)。 通常、こう言った問題も確率/統計の方ではあまり出ない形の問題なんで、やはり数学の数列ないしは 級数の問題として考えた方がイイでしょう。出題者の狙いは明らかにそちらの方にあると思います。 ところで、秋山仁先生じゃないんですが、こう言った問題を考える際に、いきなり数式を書き下すのではなく、 やはり実際にいくつか結果を列挙してみてパターンを調べてみるのが大事です。実験ですよ、 実験。 と言うのも、数列/級数と言えば、すぐ公式、と考えがちではあるんですが、原則、数列/級数なんてのは無限大 を相手にする計算です。一朝一夕には行かないんですね。過去、様々な数学者が色々無限大を相手に計算で格闘 してみたりしてまとめた公式が現代使われているんですが、僕らも数列を公式を当て嵌めるだけの数学で はなくって、実際色々実験してみる探索型の数学である、と言う部分にもっと自覚的になるべきだとは思 います。色々調べてみて規則性を見つける。そしてそれが一般的に成り立つのかどうか検証するのが 数学的帰納法なんです。まあ、そう言った部分をアタマの片隅にでも置いていただければな、と思いま す。僕が言うのも何なんですけどね(笑)。数学嫌いだから(笑)。 さて、まずは最も単純なケースを考えてみたいと思います。n=4の時はどうなのか?と。(n=3の場合は自明です) 確率の設定方法は前出の問題がかなり参考になるとは思います。が、一つ大きな違いは、 分母が減少していくと言う部分です。これが導く性質に付いてはあとで考えてみましょう。 n=4の場合、期待値の定義(①)に従って計算すると、 n=4の場合: E(X)=1*3/4+2*(3/3)*(1/4)=5/4 になりますね。これ以上は考えられません。と言うのも、1回目失敗したら2回目には 必ず白球は出るからです。 では、n=5の場合を見てみましょうか。 n=5の場合: E(X)=1*3/5+2*(3/4)*(2/5)+3*(3/3)*(1/4)*(2/5)=6/4 最後、約分が中途半端なのは意図的です。 では、n=6の場合を見てみましょう。 n=6の場合: E(X)=1*3/6+2*(3/5)*(3/6)+3*(3/4)*(2/5)*(3/6)+4*(3/3)*(1/4)*(2/5)*(3/6)=7/4 う~ん、どうですか?ちょっと規則性が見えてきたカンジがしますね。念のためもう一丁試してみましょうか。 n=7の場合です。 n=7の場合: E(X)=1*3/7+2*(3/6)*(4/7)+3*(3/5)*(3/6)*(4/7)+4*(3/4)*(2/5)*(3/6)*(4/7)   +5*(3/3)*(1/4)*(2/5)*(3/6)*(4/7)=8/4 ハイ。大体予想が付きましたね。期待値E(X)はnの関数のようで、それは
E(X)=(n+1)/4
で表されるようです。つまりこの部分が予測ですね。 ではその予測が正しいのかどうか、それを調べなきゃいけない。まあ、マス埋めの問題でしたら、上の答えを そのまま書いても当るにせよ当らないにせよ、それこそ確率は1/2ですが(笑)、数学は目的があくまで 一般化です。上の予測が正しいかどうかやってみましょう。 とは言っても、答えは大体出てるので目標とする値は既に分かってるんです。その辺りは幾分気持ちはラクなん じゃないですかね?答えが皆目見当が付かない、幾何学なんかの問題に比べればやる事はハッキリとして います(笑)。 さて、こうやって実験してみると次の性質に気付くと思います。それは
期待値E(X)の項数はn-2個である
と言う事です。 これは考えてみれば当然なんですが、ハズれまくっても必ず最後には白球は出るんです。すなわち、前出の問題 と違って無限大を相手に考えなくても良いと言うのがこの問題の特徴です。分母がどんどん減少(n≧3) していきますからね。まずこう言った見通しが実験から分かる。すなわち、x=1からx=n-2までの和を考えろ、 と言う事が言えるんです。 では、級数のスタイルで考える前に、上の実験のn=Nの場合、どう書けるのか考えてみます。 n=Nの場合: E(X)=1*3/N+2*3/(N-1)*(N-3)/N+3*3/(N-2)*(N-4)/(N-1)*(N-3)/N         +4*3/(N-4)*(N-5)/(N-2)*(N-4)/(N-1)*(N-3)/N+・・・・・・・・・ =1*3*1/N+2*3*(N-3)/{N*(N-1)}+3*3*{(N-3)*(N-4)}/{N*(N-1)*(N-2)}         +4*3*{(N-3)*(N-4)*(N-5)}/{N*(N-1)*(N-2)*(N-3)}+・・・・・・・・・⑦ かなりややこしくなっていますが(笑)。 問題は、⑦式が①で定義されている期待値の式、
E(X)=Σx*f(x)
の形式で書けるのかどうか、と言うのが焦点になってくるんです。 もっと言うと、f(x)がどう言った一般的な形式で書けるのか、と言う部分です。ここでちょっと知恵を絞ら ないといけない。 そこで、各項のf(x)の項を精査してみましょう。 f(1)=3*1/N f(2)=3*(N-3)/{N*(N-1)} f(3)=3*{(N-3)*(N-4)}/{N*(N-1)*(N-2)} f(4)=3*{(N-3)*(N-4)*(N-5)}/{N*(N-1)*(N-2)*(N-3)} ・・・・・・・・・ なんか規則性がありそうななさそうな・・・・・・。さて、どうしましょう? 分子も分母も項の数はxの増減にしたがって一つづつ増減していますね。しかもNが絡んだ項は1つづつ減らした モノが順次掛けられていってる様子です。こう言う場合は・・・・・・。 結論から言うと、階乗絡みなのです。N!=N*(N-1)*(N-2)*・・・・・・と言うアレです。 例えば、分子に着目すると、xが関係無かったら
(N-3)*(N-4)*(N-5)*・・・・・・=(N-3)!
で表現できれば、これは一定ですし安定しています。しかし実際はそうはなっていません。 そこで視点を変えて分子に整合性を持たせる為、(N-3)!を何かで割ってしまうと言う策略を考えるん です。何で割るかって?同じく階乗で割るんです。ここを工夫してxの関数にしてしまう。 つまり、f(x)のN絡みの分子を
(N-3)!/(N-x-2)!
と表現する。そうすると、 x=1の時: (N-3)!/(N-3)!=1 x=2の時: (N-3)!/(N-4)!=N-3 x=3の時: (N-3)!/(N-5)!=(N-3)*(N-4) ・・・・・・ と整合性が取れますね。やった(笑)!!! 同様に、分母のN絡みの項でも、
N!/(N-x)!
だと言う予想が付きます。従って、f(x)の部分は、 f(x)=3*(N-3)!/(N-x-2)!*(N-x)!/N!・・・・・・⑧ となります。そして、注意深く見ると、⑧式自体の階乗の部分も約分出来ることに気づくでしょう。 ⑧式は f(x)={(N-x)*(N-x-1)}/{N*(N-1)*(N-2)}・・・・・・⑧' と書き換えられるのです。 従って、⑦式は E(X)=Σx*{(n-x)*(n-x-1)}/{n*(n-1)*(n-2)}・・・・・・⑨(x=1からx=n-2までの和) となります。 以前にも別の問題で書きましたが、上の式は極端な話xに付いての関数なので、総和でnと言う数は出て きますが、nだけの項は何ら数列に影響を与えないのでΣの外にくくりだす事が出来ます。つまり、 E(X)=1/{n*(n-1)*(n-2)}*Σx*(n-x)*(n-x-1)・・・・・・⑨'(x=1からx=n-2までの和) となり、またもうちょっと整理すると、 E(X)=1/{n*(n-1)*(n-2)}*Σ{x^3-(2*n-1)*x^2+n*(n-1)*x} =1/{n*(n-1)*(n-2)}*{Σx^3-(2*n-1)*Σx^2+n*(n-1)*Σx}・・・・・・⑨''(x=1からx=n-2までの和) と書き換えられます。ここまで来たら後は簡単ですね。何故なら、あとは単に数列の和の公式を当て嵌めて 解く、単純な算数の問題に帰着するから、です。 すなわち、教科書には Σx=? Σx^2=? Σx^3=? と言う級数の公式が紹介されているハズです。それらを代入して、 E(X)=(n+1)/4 になる事を調べれば済みます。 以上です。