P*******b 发帖数: 1001 | 1 . 有一个fair的硬币,反复投,你可以选择什么时候停止投。如果你选择停止投,你
可以得到的钱等于投到正面的次数除以投的总次数,问如何设计strategy使得得到的钱
尽量多。(提示用DP)
thanks |
b******7 发帖数: 92 | 2 期望之是E(f(infinity)) = 0.5,所以策略是当前f(n)> 0.5时停止,否则继续 |
P*******b 发帖数: 1001 | 3 . 有一个fair的硬币,反复投,你可以选择什么时候停止投。如果你选择停止投,你
可以得到的钱等于投到正面的次数除以投的总次数,问如何设计strategy使得得到的钱
尽量多。(提示用DP)
thanks |
b******7 发帖数: 92 | 4 期望之是E(f(infinity)) = 0.5,所以策略是当前f(n)> 0.5时停止,否则继续 |
f********x 发帖数: 2086 | 5 求解答,怎么应用DP,搜历史贴子出处貌似是two sigma |
d********e 发帖数: 239 | 6 我觉得是,当正面比反面多1时就停止
不知道对不对
假设前一次正门为n1,反面为n2,则这一次赢钱为 n1/(n1+n2)
下一次赢钱的期望为 (1/2*(n1+1)+1/2×n1)/(n1+n2+1)
可以算出 当n2>n1时,下次赢钱多一些,所以可以继续投硬币,
【在 P*******b 的大作中提到】 : . 有一个fair的硬币,反复投,你可以选择什么时候停止投。如果你选择停止投,你 : 可以得到的钱等于投到正面的次数除以投的总次数,问如何设计strategy使得得到的钱 : 尽量多。(提示用DP) : thanks
|