期待値=
というだけの話なんですが、これしか頭にないと同じ式変形に毎回一生を費やしてしまうので典型的な用法をメモしておく。
問題:
S+1の状態があり、状態0から始めて、状態Sに到達したら終了。
1回の操作で状態iから状態jに遷移する確率がのとき、終了するまでの操作回数の期待値は?
前置き:
グラフがDAG→DPしろ
本題に入る前に典型問題を一つ
問題:
裏が出るまでコイントスする。期待値何回?
答え:
n回目のコイントスをする確率が(1/2)^nだから、
元の問題に戻る
のi,j≠Sを並べてできる行列S×S行列をPとすると求める期待値は
求まった。
問題2:
S+1の状態があり、状態0から始めて、状態Sに到達したら終了。
1回の操作で状態iから状態jに遷移する確率がであり、このときコストがかかる。終了するまでのコスト期待値は?
のi,j≠Sを並べてできる行列S×S行列をP、i≠S並べてできるS×(S+1)行列をQとすると求める期待値は
求まった。ここではアダマール積(element-wise product)を表す。
問題3:
S+Kの状態があり、状態0から始めて、状態x≧Sに到達したら終了。
1回の操作で状態iから状態jに遷移する確率がであり、状態S+kで終了するまでの操作回数の条件付き期待値は?
のi,j< Sを並べてできる行列S×S行列をP、i< S,j≧Sを並べてできるS×K行列をRとすると求める期待値は
になる。
第1項は「終了までの操作回数の期待値のうち、状態S+kで終了するものの寄与分」で、
第2項は「終了したときの状態がS+kである確率」