ai_math_runningのブログ

最近はAI関係の記事が多い予定です。一応G検定持ってる程度の知識はあります。

確率の期待値はどういう意味があるか 〜宝くじの例で説明する

ブコメでも書いたのですが、「【フルカラー図解】 高校数学の基礎が150分でわかる本 | 米田 優峻 |本 | 通販 | Amazon*1の次の紹介記事に気になる記述がみられたんです。
e869120.hatenablog.com
以下、引用です。

ある宝くじを 1 枚買うのに 300 円かかります。当たりの賞金と確率が以下のとおりであるとき、宝くじを買うのは得ですか。損ですか。
1 等:賞金 1 万円/確率 1%
2 等:賞金 300 円/確率 20%
3 等:賞金 0 円 (ハズレ)/確率 79%
もし高校 1 年で習う「期待値」の計算方法を知っていれば、答えがわかります。

期待値を計算すると、平均して (10000×0.01) + (300×0.2) + (0×0.79) = 160 円の賞金しかもらえないとわかるので、この宝くじを買うのは損であると考えられます。

こういう例は、期待値の例として良く用いられているのですが、ちょっと期待値の例としてはあまり適当ではないというか、ちゃんと説明しないと不親切ではないかな、と思うので、それについて書いてみたいと思います。

宝くじを買う人にとっての損益

宝くじを買う人にとって、得とか損とかって、どうなっているでしょうか。
上で引用した例に則って検討しましょう。
それは、

  1. 1等が当たったなら1万円から300円を引いた9700円得である。
  2. 2等が当たったなら差し引きゼロで得でも損でもない
  3. 3等が当たったなら300円の損である。

当たり前ですが、これ以外にはなり得ないです。
当選金の期待値が160円だから、160円 ー 300円で140円のマイナス、というのは計算自体はできますが、実際に140円損する、という事は起こる事はない訳ですね。
実際にそんな事が起こらないのなら、この140円の損というのは、どのような意味があるのでしょうか。

期待値の説明をされる時、このような計算をして得だ損だ、という話はされるのですが、それがどのような意味を持っているのか、という事の説明がすっ飛ばされている事が多いように思います。
なので、上記の本の本文中で、そういった説明がなされているのでしたら、それは素晴らしい本だと思うのですが、少なくともこの記事を読むだけでは、このような計算ができて、だから損なんです、という説明でさらっと済まされているように思うんですよね。
で、説明された方も、なんとなくそういうものかな、で流してしまっていると思うのですが、それでちゃんと納得している訳ではないと思うのです。*2

では、そんな偉そうな事を言って、お前は説明できるのか、と思われるでしょうから、ここからその説明を試みたいと思います。

期待値の意味

まず、期待値とは何か、を簡単に説明します。
Wikipediaの記載では次の通りになっています。

期待値は確率変数を含む関数の実現値に確率の重みをつけた加重平均である

上記の宝くじの例で言うなら、「関数の実現値」というのは、宝くじに当たった時の各等での当選金額(1等では1万円、2等では300円、3等では0円)になります。
それに、それぞれの等の起こる確率(1等は1%、2等は20%、3等は79%)をかけて、それらを合計したものが「期待値」になります。

では、そのように計算したものは、どういう意味を持っているのでしょうか。

それは、
「その試行(上記の例では宝くじを買うという行為)を何度も繰り返した場合の実現値の総量を1回辺りの値に換算したもの」
になります。
数学的に厳密に言うなら「試行を無限回繰り返した場合」になるのですが、とにかくたくさん繰り返した場合、です*3
ここでのポイントは「多数回繰り返した場合」「総量」である、という事です。

ちょっとした思考実験

この事を納得して頂くために、ちょっと思考実験をしてみましょう。
もし、宝くじを全て買い占める事ができたなら、その中には必ず高額な1等のくじが含まれる事になります。
ただし、そのために必要なお金(宝くじを買い占めるお金)は膨大な金額が必要になるでしょう。
その時の全体の収支は、恐らくほぼ全ての宝くじではマイナスになるでしょう。
この時、総額でどれくらいの収支になるか、を1枚辺りで表したものが、期待値での収支になるのです。

宝くじを買い占めるというと荒唐無稽に感じるでしょう。しかし、世の中には宝くじの当選確率を上げるために、何百枚とか何千枚とか宝くじを買う人というのが存在しているそうです。それを宝くじがあるたびにやっている、という事のようです。
そういう人の話では、さすがに高額の当選というのはないけれど、低額の当選自体は度々あって、それなりにリターンはある、という事を言っています。しかし、それらのトータルでの収支はどうか、となると、それだけの回数を繰り返していれば、恐らくは期待値で計算できる値に近づいているのではないかと予想されます。*4

JRA貯金とは

よく競馬好きの人の間では、競馬に費やしてきたこれまでの金額の収支がマイナスである事を「JRA貯金」と言ったりしているそうです。
これは、これまでの収支がマイナスであるから、この後も続けていればその分を取り返す事ができる筈だ、という信念によるものだろうと思われるのですが、そのような「信念」の根拠となっている考え方は、「何度も繰り返し行う」場合の「総額で考える」という、期待値が当てはまるものとなっているんですよ。
そして、こういうギャンブルは普通は、期待値としてはマイナスになる(それは逆にJRA側からすればプラスで、その差額で馬を育てたり各種の運営が行われているので当然の事です)ので、「JRA貯金」というものはあり得ない、という事が言えるでしょう。*5
こういうケースで期待値を使うのは意味がある、と思います。

期待値の意味のまとめ

つまり、期待値というのは、「多数回繰り返す」場合の「総額」を考える時に有効になる概念な訳で、冒頭の宝くじを一枚だけ買う場合には、あまり意味のある数字ではないと思います。

宝くじというのは、たとえ紛失したとしてもショックが少ないくらいの金額くらいを買って、まあ大抵は外れてしまうのだけど、ひょっとして当たるかもしれない、そうすると大きいぞ、と考えてわくわくドキドキする、わくわくを味わう(それを少額の金額で)という庶民のささやかな娯楽なんだと思うんです。
それを「期待値ではマイナスだから損なんだ」と切り捨ててしまうって、じゃぁあなたは宝くじを滅ぼしたいのか、と思うんですよ。
ただし、先に挙げたような、生活を切り詰めてまで何百枚も何千枚も買っているような人に対しては、期待値という概念を理解してもらう意味はあるでしょう。*6

別の事例・保険について

期待値というのが「多くの回数の総額では意味があり、個々の回数では意味がない」という事を、ある意味、利用して成り立っていると言えるものがあります。
それが「保険」というものです。

例えば災害保険の場合、その災害に遭ってしまう確率というのは非常に低いため、保険金を受け取る期待値というのは、支払った保険料からすれば大きく下回るだろうと予想されます。
では、保険というのは意味がないのか、というと、そんな事はないです。
というのは、非常に確率が低かったとしても、その災害に遭ってしまうと損害が膨大すぎて人生が破綻してしまう、という事になりかねません。
その時に保険に入っていれば、その保険金によって、災害の損害をリカバリーできる事で助かる事になる訳です。
そのために、確率的には多くの場合は何もなくても、保険料という受け入れ可能な「損」を受け入れる事で、災害のリスクに備えている、というのが保険の意味になります。

保険会社の役割

それで、その「保険」という仕組みが成り立つためには、「その多数の試行の繰り返しの総額」を担ってくれる存在が必要です。それが保険会社です。
一人一人の人生は1回限りですが、その保険に加入している人が何百万人と居れば、保険会社にとっては「何百万回の試行」を行っている事になり、その総額としてプラスとなっていれば、保険金を支払う事ができる訳です。
つまり、保険というのは、個々人にとって、と、保険会社にとって、とで、期待値の意味が違っている、という事を利用した仕組みと言えるでしょう。
なので、保険会社が儲かっているというのを批判するのは間違っています。逆に保険会社にはちゃんと利益を出して存続してもらわないと、「多数回の試行の総額」を担う存在がいなくなってしまい、保険の仕組みが成り立たなくなるのですから。*7

ここまでの説明で、期待値というのが、どういう意味を持っているか、を理解して頂けましたでしょうか。

数学を理解する事

それで、ここからは個人的な意見になります。
数学を理解する上で重要なのは、例えば期待値の場合、期待値の計算方法を理解するよりも、ここまで説明してきたような、現実に当てはめる場合に、どういうケースでは意味があり、どういうケースでは意味がないのか、という事を理解する方が重要なのではないか、と思うのです。
今はコンピュータが進化したので、計算はコンピュータがやってくれます。それよりも、現実にあてはめるとどういう意味があるのか、という事を理解する方が、どのような計算をコンピュータにさせると意味あるか、といった事が判断できるようになると思うのです。

*1:こういう数学をわかりやすく説明して普及を目指す本を書かれる事は素晴らしいと思っています。

*2:数学が得意なつもりの人でも、この説明がちゃんとできる人がどれだけいるでしょうか。

*3:有限回である限りばらつきは出るのですが、そのばらつきも回数が増えれば増えるほど小さくなります。つまり回数が増えるほど総量を回数で割った値は期待値に近づいていきます。

*4:もっとも、宝くじというのは1等の賞金が非常に高額なので、それが当選すればかなりの枚数を購入していても収支は大きくプラスになると思われるので、ばらつきの非常に大きい例ではあるのですが。

*5:実はギャンブルの収支の期待値がゼロだった場合も、「これまでの収支がマイナスだから今後続ければその分を取り返せる筈」というのは確率論的には間違いだったりします。これは数学が得意な人でも勘違いが多い間違いです。もしリクエストがあるなら、それについての解説記事も書きますが。

*6:別に何千枚買っても生活に支障がない金持ちさんが買う分には、好きにしてもらえば良いと思います。

*7:ただし、保険会社で良く聞く、販売員に過剰なノルマを課して、販売員がその保険を必要としていない友人や親戚に保険を買ってもらわざるをえなくなり、人間関係に支障をきたしてしまう、というのがあるのなら問題だとは思います。