ai_math_runningのブログ

最近はAI関係の記事が多い予定です。一応G検定持ってる程度の知識はあります。

「きょうだいベイズ問題」を説明する

少し前にはてなブックマークの人気記事に次のような記事が挙がっていました。
chieosanai.hatenablog.com
この記事、私もブコメしたんですが、ブコメを見ると2/3派の人がかなり散見していました。
b.hatena.ne.jp
ただ、ブコメでも指摘しているように、2/3派の人は根本的な勘違いをしているようなので*1
それについて、ちょっと丁寧に説明してみます。

確率の定義

多くの人*2は、いわゆる「古典的確率」で確率の定義を理解していると思います。
つまり、

全ての場合の数に対する、対象事象の場合の数

これが多くの人の理解している確率の定義です。

少し例を挙げましょう。
サイコロは、6つの面があり、それぞれの面に1から6までの数字が割り振られています。
そして、サイコロを振った時に、その目が偶数になる確率を求めます。
その時は、

  • 全ての場合の数:6通り
  • 偶数になる場合の和:3通り(2, 4, 6)

なので、偶数になる確率は、3/6 = 1/2
として求められる訳ですね。
多少複雑になっても、この延長線上で確率は求められる訳です。

重要な前提

ただし、古典的確率についてのWikipediaの記述にもあるように、この求め方をするには、1つ重要な条件があります。それは、

起こりやすさに差異が認められない全ての場合の数

つまり、分母にする「全ての場合」は、同じ確率で起こるものでないといけない訳です。

同じ確率で起こらない事例

盛山サイコロ

朝の番組『ラヴィット!』において、「盛山サイコロ」なるものが偶に出て来ます。
『ラヴィット!』を知らない人向けに説明すると*3
ラヴィット!では美味しい食べ物の試食が度々行われますが、それを是非とも盛山さんにやってもらいたいと願った番組スタッフが技術の総力を結集して特殊なサイコロを作成します。
そのサイコロは、6面中5面が盛山さんになっていて、盛山さんが当たる確率は5/6になっています。
しかし、実際にそのサイコロを振ってみると、何度やっても盛山さん以外の面が出てしまいます*4

要するにイカサマなんですが、盛山サイコロほど極端ではなくても、中の重心を変えたりして出る目の確率に差がでるように細工したイカサマなサイコロというのは作る事ができて、そのサイコロを使うと、「古典的な確率」の求め方で求めたものとは異なってしまう訳です。当然、偶数が出る確率も変わってくるでしょう。

重要な教訓

この場合はイカサマですが、古典的確率の手法で確率を求める時は、分母にする全ての場合がちゃんと同じ確率になっているかをチェックする習慣を付けた方が良いと思います。

きょうだいベイズ問題:2/3派の主張

で、「きょうだいベイズ問題」に移りましょう。問題はこういうものだそうです。

2人きょうだいの子供のうち、1人が男の子の場合、もう1人が女の子である確率はいくらか?

これについての2/3の説明は以下のものだそうです。(ちょっと表を書き換えています。)

2人兄弟の場合は以下の表のように、4通りある。

j k l m
older
younger

問題の条件からどちらも女性のペアである m は除外できる。
全パターンは j と k と l の3パターン。
そのうち特定の事象のパターンは k と l の2パターン。
ゆえに 2/3 。

他にも色々な論法を振り回す人は現れますが、2/3と主張している人は、基本的にはこの考え方に依拠していると思われます。

きょうだいベイズ問題:2/3派の主張のおかしな点

さて、この論法に対して、私は正面から反論しようと思います*5

上記、2/3派の主張は、古典的確率の手法で確率を求めています。
しかし、その場合は、分母にした全ての場合、この場合は「 jkl の3パターン」が、本当に同じ確率と見做して良いか、を考える必要があります。

何もなければ、j, k, l は同じ確率でしょう。しかし、その場合はmだって同じ確率です。
しかし、問題の条件からmは除去される訳です。つまり、どちらも女性であるから。
では、kl は、全く除去しなくても良いのでしょうか。

「2人きょうだいの子供のうち、1人が男の子の場合」とやる場合、2人のきょうだいの子供のうちの1人を先に見て、男か女かをチェックしている訳ですね。そして、それが男だった場合のみを考えている訳です。なので、その「先に見た子供」がolderの方なのか、yangerの方なのかをちゃんと区別して考えてみましょう。

そうすると、 先に見る「きょうだい」がolderの場合、k は除去されませんが、l は除去されます。
逆に、先に見る「きょうだい」がyoungerの場合は、k は除去され、l は除去されません。
そして、当然のことながら、どちらも場合もj は除去されず、どちらの場合もm は除去されます。

こう考えるならば、先に見るのがどちらの場合でも除去されない j と、どちらかによって除去される事もある k l とを同じ確率と見做すのは無理があります。
(というか、普通に考えれば jk, l の倍の確率と考えられるでしょう。それなら1/2になるはずです。)

2/3派の主張は、同じ確率で扱うべきでないものを、無理やり同じ確率で扱うために起こった誤解であると考えられます。

追記:元ネタの英語版Wikipediaでは問題文が少し違う

ブコメにこの問題の元ネタだろう、Wikipediaの英語版のリンクが貼られていて、ちょっと読んでみた所、問題文が少し違っていました。

  • Mr. Smith has two children. At least one of them is a boy. What is the probability that both children are boys?

DeepL翻訳

スミス氏には2人の子供がいる。少なくとも1人は男の子である。子供が2人とも男の子である確率は?

で、英語版記事ではこの問題について詳細に論じられていますが、要するに「少なくとも1人は男の子」という条件の与え方に曖昧性があり、それによって答えが異なるはずだ、という事だそうです。

ただ、「2人兄弟の1人が男の子の場合、もう1人は?」というのと、上記設問の条件では、意味合いはかなり異なりますね*6
「少なくとも1人は男の子」という場合、「2人ともチェックして、男が0の場合を除く」という可能性も考えられ、その場合、 jk, l は同じ確率と考える事が可能になります。
一方、「1人が男の子の場合」という場合、先にどちらかを見ていて、その後、もう1人を見るという意味にとりやすくなるでしょう。
「少なくとも」という文言の有無は大きいですね。
もっとも、「少なくとも」とついていても、1人ずつ順にチェックすると捉える事も可能で、それが英語版Wikipediaの「曖昧性」の話になるのでしょう。

*1:なので上記記事の結論は正しいです。

*2:公理的確率なんて大学で数学をちゃんと学んだ人しか知らないですし、しかもそれをちゃんと理解できてる人はさらに減ります。

*3:盛山サイコロでググると違法な動画はいっぱい出て来ますが、リンク貼る訳にはいかないので興味ある人はググってみてください。

*4:実際私もラヴィットミュージアムで何度も振ってみましたが、全て見事なまでに「盛山以外」が出ました。

*5:冒頭のブログ記事は例を出す事で余計に混乱させてるように思えます。

*6:問うているのが男女で異なる事は棚上げしておきましょう。