由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - 这道google面经体咋做
相关主题
报个BB面经请教一个海量数据处理的题
请教F家和T家最近的一道常见题ZocDoc Skype 面经 (update:已经悲剧)
这道雅虎的面试题绝了,有谁会做吗请教一个面试题
一个概率+编程题。我来说说bloomreach。。。
Google电面请教一面试问题
明天onsite,求下bless了面试问bloom filter,reservoir sampling过分么?
Yelp 面经Google面试回来
给后人贡献一下 pg那个游戏公司的面试题目看来只能写bug free的code 也不行
相关话题的讨论汇总
话题: dataset话题: char话题: index话题: reservoir话题: sampling
进入JobHunting版参与讨论
1 (共1页)
y*******d
发帖数: 1674
1
一个set里面有a,b,c等若干个char,设计random函数,得到某个char的概率和它
的出现次数成正比。
i******t
发帖数: 22541
2
编程题还是统计概率题。。。

【在 y*******d 的大作中提到】
: 一个set里面有a,b,c等若干个char,设计random函数,得到某个char的概率和它
: 的出现次数成正比。

y*******d
发帖数: 1674
3
编程
估计是design

【在 i******t 的大作中提到】
: 编程题还是统计概率题。。。
i******t
发帖数: 22541
4
Dirichlet-multinomial distribution?

【在 y*******d 的大作中提到】
: 编程
: 估计是design

y*******d
发帖数: 1674
5
不懂 这是啥啊
有code么

【在 i******t 的大作中提到】
: Dirichlet-multinomial distribution?
e*******s
发帖数: 1979
6
weighted reservoir sampling?

【在 y*******d 的大作中提到】
: 一个set里面有a,b,c等若干个char,设计random函数,得到某个char的概率和它
: 的出现次数成正比。

m*****n
发帖数: 2152
7
虽然算法垃圾一点,但是work的。
def test(data):
dataset = [[n, data.count(n)] for n in set(data)]
for i in xrange(2):
copydataset = copy.deepcopy(dataset)
print list(generator(copydataset))
print '\n'

def generator(dataset):
size = len(dataset)
while dataset:
index = int(random.random()*size)
dataset[index][1] -= 1
char = dataset[index][0]
if not dataset[index][1]:
dataset.pop(index)
size = size - 1
yield char
m*********a
发帖数: 3299
8
Add data to array, return a random index.
public char randomChar(){
List data = new ArrayList<>();
data.add('a');data.add('b');data.add('a')....
return data.get(new Random().nextInt(data.size()));
}

【在 y*******d 的大作中提到】
: 一个set里面有a,b,c等若干个char,设计random函数,得到某个char的概率和它
: 的出现次数成正比。

M********x
发帖数: 76
9
Reservoir Sampling?
z*****6
发帖数: 16
10
freq总和,random(0,freq)之后得数字map回char就好了啊。reservoir sampling是
用于linkedlist而不知道总长度用的
相关主题
明天onsite,求下bless了请教一个海量数据处理的题
Yelp 面经ZocDoc Skype 面经 (update:已经悲剧)
给后人贡献一下 pg那个游戏公司的面试题目请教一个面试题
进入JobHunting版参与讨论
m*****n
发帖数: 2152
11
要是追问,数据太大内存放不下怎么办。Google会出这么简单的题?其实这是一个云计
算题。
r*******y
发帖数: 270
12
这个解法一旦被问有billion怎么办就成屎了,提示input是char不是string,一共就
256个char

【在 m*********a 的大作中提到】
: Add data to array, return a random index.
: public char randomChar(){
: List data = new ArrayList<>();
: data.add('a');data.add('b');data.add('a')....
: return data.get(new Random().nextInt(data.size()));
: }

c********t
发帖数: 5706
13
同意,因为char数量有限,数字map回char的时候可以iterate chars one by one

【在 z*****6 的大作中提到】
: freq总和,random(0,freq)之后得数字map回char就好了啊。reservoir sampling是
: 用于linkedlist而不知道总长度用的

h**********c
发帖数: 4120
14
一开始出现次数是0,概率是0,啥也不出现,成正比,概率返回条件是0.
h**********c
发帖数: 4120
15
觉得这是个behav题。
k******a
发帖数: 44
16
扫描set,将字符出现频率排序, 然后做一个frequency data的数组,
[{0.0, 0.3, a}, {0.3, 0.5, b}, {0.5, 0.6, c}, {0.6, 0.7, d}, ....]
然后随机产生0-1的浮点数,然后找个数组扫。数组最大是256个items
有点无脑?
不知道follow up是什么样子
r****t
发帖数: 10904
17
这不是 uniform sample with replacement 就行了?大数据的话用 metropolis 算法
吧最多。

【在 i******t 的大作中提到】
: Dirichlet-multinomial distribution?
b******y
发帖数: 168
18
为什么不是reservoir sampling?
1 (共1页)
进入JobHunting版参与讨论
相关主题
看来只能写bug free的code 也不行Google电面
发个google的面试题明天onsite,求下bless了
一个小题目Yelp 面经
写个ServiceNow的面经吧给后人贡献一下 pg那个游戏公司的面试题目
报个BB面经请教一个海量数据处理的题
请教F家和T家最近的一道常见题ZocDoc Skype 面经 (update:已经悲剧)
这道雅虎的面试题绝了,有谁会做吗请教一个面试题
一个概率+编程题。我来说说bloomreach。。。
相关话题的讨论汇总
话题: dataset话题: char话题: index话题: reservoir话题: sampling