一昨日の記事の続編です。
本当は昨日にこの記事を上げたかったんですけど計算が合わなくて悪戦苦闘してました。連続補正許すまじ。
数学が苦手な人は最後の方だけ見てくれ。
あるいは
こっちのデータの方だけ見るか。
「あと何回攻撃を当てたら勝てるか」を
「あと何回攻撃を当てられたら負けるか」を
として攻撃は半々の確率で選ばれた一方の攻撃のみ当たるとします。つまり両者の実力は同じですね。これを繰り返しやって勝敗が決まるまで行うのですが…
これは「回じゃんけんして
回以上勝ったら勝利」に帰着できます。(理由略)
さらにこれは確率としては、
「回じゃんけんして
回以下負けたら勝利」
と等しくなります。
と置きます。
すると回のじゃんけんの結果は二項分布に従います。
さらにそれは正規分布に近似できます。(この時「連続補正」に注意!!!)
この値が以下ならいいのですが——
これを正規化してなんやかんやすると求める確率は以下の結果になります。
標準正規分布が以下である確率。
…なんだこれ。前回「リスクとリターンを2倍にすれば勝率は2倍になると思われます。」とか書いたやつ誰だよ。俺か。いや、複雑すぎか。
要するに を大きくすればいいのですが…
この値は自分が不利な時負に、互角の時0に、有利な時正になります。
えーと。これで 「有利な時は負け筋を潰し不利な時は勝ち筋を目指すべき」は証明できてます。釈然としないけど。
を両方2倍したり二分の一したりすると値がうまいこと上下するはずです。
(は両方1以上の整数であることには注意)
そしてその上下幅は非常に不利、もしくは有利な時に大きくなります。
つまり有利であればあるほど負け筋を潰す効果が大きく、不利であればあるほど勝ち筋を作る効果が大きくなる、ということです。
この式を元にプログラムを書いてデータを取ったのがこれです。
…色々数式こねくり回したんですけどマジでこれ以上の情報ないです。
めっちゃ複雑な式でいいなら色々紹介できるけど徒労にもほどがあるのでやめときます。
結論: 「有利な時は負け筋を潰し不利な時は勝ち筋を目指すべき」は正しい!でもそれ以上の情報は0!