r*****d 发帖数: 727 | 1 我付钱让对方扔骰子(6面),对方按点数付给我钱。一共可以扔两次。第一次扔完,
我有机会说接受或者拒绝。接受的话,对方按照第一次点数付我钱。拒绝的话,对方扔
第二次,扔完按照第二次点数付钱。
问题是我最多付多少钱,保证我不亏本?
今天面试问到的,应该是统计方面的问题,(linear programming)?我没有统计背景
,(搞化学的)。
这道题是基于之前的一道题,只能扔一次骰子,我最多付多少钱。---3.5 这个倒是很
简单。
但第二道题,我就晕了。然后面试的人问我是大于3.5还是小于,我竟然说小于。。。
现在真想抽自己。。。 |
k*******a 发帖数: 772 | 2 4块钱
如果第一次1,2,3 那么再扔,这样 epxpected 3
如果第一次4,5,6, 那么就不扔了,这种情况 expected 5
所以这种策略 expected = 4 |
r*****d 发帖数: 727 | 3 谢谢回答。
为什么第一次不是2呢? ( = 1/3(1+2+3)) |
k*******a 发帖数: 772 | 4 我搞错了
第一次应该 expected (1+2+。。+6)/6=3.5
所以总的expectation是 (3.5+5)、2=4.25
【在 r*****d 的大作中提到】 : 谢谢回答。 : 为什么第一次不是2呢? ( = 1/3(1+2+3))
|
t*********h 发帖数: 941 | 5 the key question is when do you say yes/no to first toss
【在 k*******a 的大作中提到】 : 4块钱 : 如果第一次1,2,3 那么再扔,这样 epxpected 3 : 如果第一次4,5,6, 那么就不扔了,这种情况 expected 5 : 所以这种策略 expected = 4
|
j*****y 发帖数: 1071 | 6 用这种方式算出来是 4.25
怎么证明这个方式是最优的呢?
【在 k*******a 的大作中提到】 : 4块钱 : 如果第一次1,2,3 那么再扔,这样 epxpected 3 : 如果第一次4,5,6, 那么就不扔了,这种情况 expected 5 : 所以这种策略 expected = 4
|
k*******a 发帖数: 772 | 7 X: first result
Y: second result
I(X): decision on whether or not continue tossing after observing X
1 - stop 0 - continue
Eexpectation = E[I(X)X + (1-I(X))Y], since X and Y independet
= 3.5 + E[(X-3.5)I(X)]
to maximize expectation when (X-3.5) < 0 let I(X)=0
when (X-3.5) >0 let I(X) = 1
【在 j*****y 的大作中提到】 : 用这种方式算出来是 4.25 : 怎么证明这个方式是最优的呢?
|
j*****y 发帖数: 1071 | 8 thanks.
【在 k*******a 的大作中提到】 : X: first result : Y: second result : I(X): decision on whether or not continue tossing after observing X : 1 - stop 0 - continue : Eexpectation = E[I(X)X + (1-I(X))Y], since X and Y independet : = 3.5 + E[(X-3.5)I(X)] : to maximize expectation when (X-3.5) < 0 let I(X)=0 : when (X-3.5) >0 let I(X) = 1
|
r*****d 发帖数: 727 | 9 嗯 我也明白怎么回事了
谢谢
【在 k*******a 的大作中提到】 : X: first result : Y: second result : I(X): decision on whether or not continue tossing after observing X : 1 - stop 0 - continue : Eexpectation = E[I(X)X + (1-I(X))Y], since X and Y independet : = 3.5 + E[(X-3.5)I(X)] : to maximize expectation when (X-3.5) < 0 let I(X)=0 : when (X-3.5) >0 let I(X) = 1
|