【世界のアソビ大全51】ヨットを数学的に考える①:基礎知識編

こんにちは。
あなたはヨットというサイコロゲームをご存知でしょうか?これは Nintendo Switch のゲーム「世界のアソビ大全51」に収録されている、二人対戦のゲームです。

ヨットのイメージ。公式サイトより引用
ヨットのイメージ。公式サイトより引用

運要素と戦略要素が程よく含まれるゲームになっていて、やればやるほど深みにハマるとても面白いゲームです。

今回は数学的なアプローチを使って、このゲームの性質に迫っていきたいと思います。ただ、構想段階ですでに分量が多くなりすぎてしまったので、記事をいくつかに分けて、シリーズものとしてお届けします。この記事では「①:基礎知識編」と題して、確率に関する基礎的な知識について説明します。

この記事は #じゃぱねっと夏の自由研究 に参加しています。

期待値とは

次のようなシンプルなサイコロゲームを考えます。

サイコロを1回振る。出た目があなたの点数となる。

もしサイコロの目に偏りがないなら*1、それぞれの目が出る確率は以下のようになります。

サイコロの目 出る確率
"1" \dfrac{1}{6}
"2" \dfrac{1}{6}
"3" \dfrac{1}{6}
"4" \dfrac{1}{6}
"5" \dfrac{1}{6}
"6" \dfrac{1}{6}

さて、このゲームをすごくたくさん遊ぶことを考えてみます。あなたの思いつくものすごく大きい数を思い浮かべて、その回数だけ実行することを考えてみてください。100万回でも1億回でも5000兆回でも1無量大数回でもグラハム数回でもいいです。とにかくたくさん遊びます。

そうすると、ほんのちょっとのばらつきはあるものの、それぞれの目の出る回数は、いずれもおおよそ全体の \dfrac{1}{6} 程度になることが予想されます。例えば遊んだ回数が6億回なら、それぞれの目が出た回数はおおよそ1億回ずつになることが期待されます。

これらの点数の平均値を求めてみましょう。遊んだ回数を N とし、1回目, 2回目, 3回目, ... N 回目の点数をそれぞれ a_{1}, a_{2}, a_{3}, \dots, a_{N} とすると、平均値を表す数式は次のようになります。

\dfrac{a_{1} + a_{2} + a_{3} + \dots + a_{N}}{N}

ここで a_{1}, a_{2}, \dots, a_{N} のうち、大体 \dfrac{N}{6} 個が1, 大体 \dfrac{N}{6} 個が2, 大体 \dfrac{N}{6} 個が3, ..., 大体 \dfrac{N}{6} 個が6なので、以下の近似が成り立ちます。(\approx は "大体等しい" という意味です)
a_{1} + a_{2} + \dots + a_{N} \approx 1 \cdot \dfrac{N}{6} + 2 \cdot \dfrac{N}{6} + \dots + 6 \cdot \dfrac{N}{6}

すると、平均値は以下のように近似的に求まります。
\dfrac{a_{1} + a_{2} + a_{3} + \dots + a_{N}}{N} \approx 1 \cdot \dfrac{1}{6} + 2 \cdot \dfrac{1}{6} + \dots + 6 \cdot \dfrac{1}{6}

なんと、N がきれいに消えました。この右辺の値を期待値と呼びます。すなわち期待値とは、同じ条件の下で確率的な操作を多くの回数繰り返したときに、その結果の値の平均値として期待される値を意味します。先ほどの式を計算してみると、このゲームの点数の期待値は \dfrac{7}{2} と求まります。

期待値の計算式には、各事象(ここでは目の出方のこと)における点数と、その事象が起こる確率だけが出てきていることに注意してください。つまり期待値は、起こり得る事象をすべて列挙して、各事象に対して (点数)×(確率) を計算し、それらを総和することで求められます。

選択権のあるゲームの最良の戦略

私たちは期待値という武器を手に入れました。次に、少しだけ戦略性のあるゲームを考えてみましょう。

サイコロを1回振る。その後、次のいずれかを選択する。

  • その出た目をあなたの点数とする。
  • もう1回サイコロを振り、出た目をあなたの点数とする。

一度だけサイコロを振りなおせるゲームになりました。すこしだけヨットに近づきましたね。

今回のゲームでは、プレイヤーがどのような状況のときに振りなおすかの選択権が与えられています。このときの判断の戦略によって、点数が高めになったり、低めになったりするでしょう。そこで、いくつかの戦略を考えてみて、それぞれの期待値を計算し、どの戦略が優れているか考えてみます*2

具体的に、以下を考えてみましょう。どれが期待値的に有利そうか予想してみてください。
【戦略1】絶対に振りなおさない。ファーストインパクト重視。
【戦略2】絶対に振りなおす。セカンドオピニオン重視。
【戦略3】3以下なら振りなおし、4以上ならそのまま採用。臨機応変
【戦略4】5以下なら振りなおし、6なら採用。6こそ至高。

ではそれぞれの戦略について期待値を計算してみます。

【戦略1】絶対に振りなおさない。

絶対に振りなおさないということは、最初から振りなおす権利がないのと同じです。つまり「期待値とは」の章で計算した場合と全く同じになります。よって点数の期待値は \dfrac{7}{2} = 3.5 です。

【戦略2】絶対に振りなおす。

絶対に振りなおすということは、1回目は予行演習で、2回目が本番ということです。予行演習のことを忘却してしまえば、状況としては1回だけ振るのと同じです。したがって「期待値とは」の章で計算した結果と同じになるので、点数の期待値は \dfrac{7}{2} = 3.5 となります。

【戦略3】3以下なら振りなおし、4以上ならそのまま採用。

戦略1, 2 ほどすっきり計算できないので、覚悟を決めてすべての事象を列挙します。事象に関する情報を表にまとめたものが以下になります。

1回目 2回目 起こる確率 点数
"1" "1" \dfrac{1}{36} 1
"1" "2" \dfrac{1}{36} 2
"1" "3" \dfrac{1}{36} 3
"1" "4" \dfrac{1}{36} 4
"1" "5" \dfrac{1}{36} 5
"1" "6" \dfrac{1}{36} 6
"2" "1" \dfrac{1}{36} 1
"2" "2" \dfrac{1}{36} 2
"2" "3" \dfrac{1}{36} 3
"2" "4" \dfrac{1}{36} 4
"2" "5" \dfrac{1}{36} 5
"2" "6" \dfrac{1}{36} 6
"3" "1" \dfrac{1}{36} 1
"3" "2" \dfrac{1}{36} 2
"3" "3" \dfrac{1}{36} 3
"3" "4" \dfrac{1}{36} 4
"3" "5" \dfrac{1}{36} 5
"3" "6" \dfrac{1}{36} 6
"4" - \dfrac{1}{6} 4
"5" - \dfrac{1}{6} 5
"6" - \dfrac{1}{6} 6

めまいがしそうなぐらい数がありますが、少しずつ計算していけば大丈夫です。

まず1回目が1の目の部分から。すこし工夫して、すでに答えを知っている計算を流用できるようにしてみます。

\begin{align}&\hphantom{{}={}} 1 \cdot \dfrac{1}{36} + 2 \cdot \dfrac{1}{36} + \dots + 6 \cdot \dfrac{1}{36} \\ &= \dfrac{1}{6} \cdot \left( 1 \cdot \dfrac{1}{6} + 2 \cdot \dfrac{1}{6} + \dots + 6 \cdot \dfrac{1}{6} \right) \\ &= \dfrac{1}{6} \cdot \dfrac{7}{2} \\ &= \dfrac{7}{12} \end{align}

次に1回目が2の目の部分を計算します。よく考えると、計算式は先ほどと同じになります。なのでこの部分は同じく \dfrac{7}{12} となります。

1回目が3の目の部分も同様で、同じく \dfrac{7}{12} となります。

最後に1回目が 4, 5, 6 の目の場合をまとめて計算します。

4 \cdot \dfrac{1}{6} + 5 \cdot \dfrac{1}{6} + 6 \cdot \dfrac{1}{6} = \dfrac{5}{2}

以上から期待値は

\dfrac{7}{12} + \dfrac{7}{12} + \dfrac{7}{12} + \dfrac{5}{2} = \dfrac{17}{4} = 4.25

となります。

【戦略4】5以下なら振りなおし、6なら採用。

やはり覚悟を決めてすべての事象を列挙します。事象に関する情報を表にまとめたものが以下になります。

1回目 2回目 起こる確率 点数
"1" "1" \dfrac{1}{36} 1
"1" "2" \dfrac{1}{36} 2
"1" "3" \dfrac{1}{36} 3
"1" "4" \dfrac{1}{36} 4
"1" "5" \dfrac{1}{36} 5
"1" "6" \dfrac{1}{36} 6
"2" "1" \dfrac{1}{36} 1
"2" "2" \dfrac{1}{36} 2
"2" "3" \dfrac{1}{36} 3
"2" "4" \dfrac{1}{36} 4
"2" "5" \dfrac{1}{36} 5
"2" "6" \dfrac{1}{36} 6
"3" "1" \dfrac{1}{36} 1
"3" "2" \dfrac{1}{36} 2
"3" "3" \dfrac{1}{36} 3
"3" "4" \dfrac{1}{36} 4
"3" "5" \dfrac{1}{36} 5
"3" "6" \dfrac{1}{36} 6
"4" "1" \dfrac{1}{36} 1
"4" "2" \dfrac{1}{36} 2
"4" "3" \dfrac{1}{36} 3
"4" "4" \dfrac{1}{36} 4
"4" "5" \dfrac{1}{36} 5
"4" "6" \dfrac{1}{36} 6
"5" "1" \dfrac{1}{36} 1
"5" "2" \dfrac{1}{36} 2
"5" "3" \dfrac{1}{36} 3
"5" "4" \dfrac{1}{36} 4
"5" "5" \dfrac{1}{36} 5
"5" "6" \dfrac{1}{36} 6
"6" - \dfrac{1}{6} 6

戦略3よりさらに数が多くなってうげぇとなりそうですが、計算の内容自体はほぼ戦略3と変わりません。

1回目が1~5のいずれかの目となる各部については、戦略3のときと同様それぞれ \dfrac{7}{12} となります。

1回目が6の目の部分は 6 \cdot \dfrac{1}{6} = 1 となります。

以上を合わせると、期待値は

\dfrac{7}{12} \cdot 5 + 1 = \dfrac{47}{12} = 3.91666\dots

となります。

期待値の比較

以上の計算結果をまとめると、次のようになりました。

【戦略1】\dfrac{7}{2} = 3.5
【戦略2】\dfrac{7}{2} = 3.5
【戦略3】\dfrac{17}{4} = 4.25
【戦略4】\dfrac{47}{12} = 3.91666\dots

ということで、期待値を基準にすると、戦略3がもっとも優れた戦略と判明しました!

計算方法再考

実は、戦略3の期待値は、以下のゲームの期待値と同じになります。

各面に次の数が書かれた6面サイコロを考える。

\dfrac{7}{2}, \dfrac{7}{2}, \dfrac{7}{2}, 4, 5, 6

このサイコロを1回振り、出た目が点数となる。

実際に計算してみましょう。

\begin{align}&\hphantom{{}={}} \dfrac{7}{2} \cdot \dfrac{1}{6} + \dfrac{7}{2} \cdot \dfrac{1}{6} + \dfrac{7}{2} \cdot \dfrac{1}{6} + 4 \cdot \dfrac{1}{6} + 5 \cdot \dfrac{1}{6} + 6 \cdot \dfrac{1}{6}\\&=\dfrac{7}{12} + \dfrac{7}{12} + \dfrac{7}{12} + \dfrac{5}{2} \\ &= \dfrac{17}{4} \end{align}

確かに一致しました。勘が鋭い方は、途中計算も先ほどと全く同じであることに気づいたかもしれません。

なぜ一致するのか考えてみます。戦略3では、1, 2, 3 の目が出たときは必ず振りなおすことにしていました。振りなおしたとき、出目の期待値は \dfrac{7}{2} となることは「期待値とは」の章で計算したとおりです。ということは、仮にものすごい回数遊んだとして、そのうち1回目に1が出たときの場合をかき集めると、そのときの点数の平均値はおおよそ \dfrac{7}{2} になるということです。であれば、最初から1の目を \dfrac{7}{2} と書き換えておいて、一回目で決まる、という風に解釈してもよさそうに思えます。これを 1, 2, 3 の目それぞれで行ったものが、先ほどの設定となります。

同じ要領で、戦略4の期待値は以下のゲームの点数の期待値と同じになります。

各面に次の数が書かれた6面サイコロを考える。

\dfrac{7}{2}, \dfrac{7}{2}, \dfrac{7}{2}, \dfrac{7}{2}, \dfrac{7}{2}, 6

このサイコロを1回振り、出た目が点数となる。

期待値を計算するとこのようになります。

\dfrac{7}{2} \cdot \dfrac{1}{6} \cdot 5 + 6 \cdot \dfrac{1}{6} = \dfrac{47}{12}

この発想を最初から知っていれば、表を頑張って作らなくても計算できましたね。また、サイコロの目を置き換えるのであれば、\dfrac{7}{2} より小さい目だけすべて置き換えるのが最善だと分かるので、実は戦略3がすべての戦略の中で最も良い*3ということも分かります。

もっと発展的な問題も簡単に解けます。もし仮に振り直しが2回可能だとしたら、最良の戦略はどのようなものでしょうか?その場合は「どの目を \dfrac{17}{4} に置き換えると有利だろうか?」と考えればOKです。なぜなら、振りなおすと判断する目を「1回だけ振りなおせるルール」の下での最良の期待値の数値、すなわち \dfrac{17}{4} と置き換えた場合と期待値計算上は等価だからです。具体的には以下の戦略が最良です。

  • 1回目に5以上が出た場合 → それを点数とする
  • 1回目に4以下が出た場合 → 振りなおす
  • 2回目に4以上が出た場合 → それを点数とする
  • 2回目に3以下が出た場合 → 振りなおして、出た目を点数とする

まとめ

今回はヨットを数学的に考えるために、基礎となる数学的な考え方について紹介しました。次回は具体的に、ヨットのルールに沿った話をしたいと思います。

ではまた。

次回:
smooth-pudding.hatenablog.com


サイコロのイラストはこちらからお借りしました:かわいい&かっこいい無料イラスト素材集|イラストイメージ

*1:このことを「同様に確からしい」と言います。

*2:期待値が高いものがあらゆる視点で優れた戦略かというと、それは違います。例えばゲームで大きく負けている場合を考えると、その勝負に勝つには、平均的にそこそこ点を取れる戦略(=期待値で有利な戦略)よりも、確率は低いが高得点が狙える戦略を取った方がよい場合もありますね。

*3:厳密にいえば「すべての戦略」をどう定義するかによります。極端に言えば「イカサマのサイコロとこっそりすり替える」とか言い出した日にはこの限りにはありません。