由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - 请教一个随机选取的问题
相关主题
pp adv 现在还没收到,是不是没戏了?区间合并题的两种变体?
SQL combine two columns from two different tables no shared columns带限制条件的最短路径题怎么做?
同学们来帮忙解个题吧~boggle game是不是只有backtracking的解法?
转一些我blog上以前总结题目的日记[合集] SDE offer: eBay vs. VMWare
k-selection algorithm问一个关于区间的问题
onsite后被拒,怎么回复对方邮件呢?请教G家onsite一道题
经典activity selection的问题突然想起来算一下H-1b 被抽中的概率是多少
暑假总算把自个卖出去了...回报版上一个吧贴个概率题
相关话题的讨论汇总
话题: 选取话题: select话题: stream话题: array
进入JobHunting版参与讨论
1 (共1页)
c****s
发帖数: 241
1
题目大概是这样:
有一个很长很长(长度不可知)的stream,现在需要从这个stream选取一个点,使每个
点被取的概率相同。问如何选取?
c**********e
发帖数: 2007
2
loop through the stream, for the n-th point (点),
exchange it with the selected one with probability 1/n.
s*****i
发帖数: 355
3
我记得wiki上有一个讲这个算法的,是从n个里面选k个。
谁还有link吗?谢谢!

【在 c**********e 的大作中提到】
: loop through the stream, for the n-th point (点),
: exchange it with the selected one with probability 1/n.

r****o
发帖数: 1950
4
只选取一个点?是不是若干个点?

【在 c****s 的大作中提到】
: 题目大概是这样:
: 有一个很长很长(长度不可知)的stream,现在需要从这个stream选取一个点,使每个
: 点被取的概率相同。问如何选取?

c**********e
发帖数: 2007
5
I do not remember the link. The approach is quite straight-forward.
Suppose we have a[1], a[2], ..., a[M], M is either unknown, or big,
or both. We need to select k of them with equal probability.
Select and store the first k record, store their subscript in an
interger array x[1]=1, x[2]=2, ..., x[k]=k.
Then for each record n=k+1, k+2, ..., we do the following to the x[]:
P(x[i]=n)=1/n for each i=1,..,k.
P(x[] no change) = 1-k/n.
In other words, with probability 1-k/n, we keep array x[]

【在 s*****i 的大作中提到】
: 我记得wiki上有一个讲这个算法的,是从n个里面选k个。
: 谁还有link吗?谢谢!

c****s
发帖数: 241
6
我给你一个包子。:)

【在 c**********e 的大作中提到】
: I do not remember the link. The approach is quite straight-forward.
: Suppose we have a[1], a[2], ..., a[M], M is either unknown, or big,
: or both. We need to select k of them with equal probability.
: Select and store the first k record, store their subscript in an
: interger array x[1]=1, x[2]=2, ..., x[k]=k.
: Then for each record n=k+1, k+2, ..., we do the following to the x[]:
: P(x[i]=n)=1/n for each i=1,..,k.
: P(x[] no change) = 1-k/n.
: In other words, with probability 1-k/n, we keep array x[]

h*******x
发帖数: 12808
7
赞,话说我当年在国内面试google,我就是挂在这个题目上。

【在 c**********e 的大作中提到】
: loop through the stream, for the n-th point (点),
: exchange it with the selected one with probability 1/n.

1 (共1页)
进入JobHunting版参与讨论
相关主题
贴个概率题k-selection algorithm
请教F家和T家最近的一道常见题onsite后被拒,怎么回复对方邮件呢?
CGG电面2经典activity selection的问题
求到所有点的距离和最短, 求助暑假总算把自个卖出去了...回报版上一个吧
pp adv 现在还没收到,是不是没戏了?区间合并题的两种变体?
SQL combine two columns from two different tables no shared columns带限制条件的最短路径题怎么做?
同学们来帮忙解个题吧~boggle game是不是只有backtracking的解法?
转一些我blog上以前总结题目的日记[合集] SDE offer: eBay vs. VMWare
相关话题的讨论汇总
话题: 选取话题: select话题: stream话题: array