avatar
P*b
1
. 有一个fair的硬币,反复投,你可以选择什么时候停止投。如果你选择停止投,你
可以得到的钱等于投到正面的次数除以投的总次数,问如何设计strategy使得得到的钱
尽量多。(提示用DP)
thanks
avatar
b*7
2
期望之是E(f(infinity)) = 0.5,所以策略是当前f(n)> 0.5时停止,否则继续
avatar
P*b
3
. 有一个fair的硬币,反复投,你可以选择什么时候停止投。如果你选择停止投,你
可以得到的钱等于投到正面的次数除以投的总次数,问如何设计strategy使得得到的钱
尽量多。(提示用DP)
thanks
avatar
b*7
4
期望之是E(f(infinity)) = 0.5,所以策略是当前f(n)> 0.5时停止,否则继续
avatar
f*x
5
求解答,怎么应用DP,搜历史贴子出处貌似是two sigma
avatar
d*e
6
我觉得是,当正面比反面多1时就停止
不知道对不对
假设前一次正门为n1,反面为n2,则这一次赢钱为 n1/(n1+n2)
下一次赢钱的期望为 (1/2*(n1+1)+1/2×n1)/(n1+n2+1)
可以算出 当n2>n1时,下次赢钱多一些,所以可以继续投硬币,

【在 P*******b 的大作中提到】
: . 有一个fair的硬币,反复投,你可以选择什么时候停止投。如果你选择停止投,你
: 可以得到的钱等于投到正面的次数除以投的总次数,问如何设计strategy使得得到的钱
: 尽量多。(提示用DP)
: thanks

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。