f*******w 发帖数: 1243 | 1 infinite stream of words, return the K most frequent words in the
last minute/hour/day
考了下古好像没什么太好的方法啊…… |
p*****2 发帖数: 21240 | |
n*******1 发帖数: 145 | |
n*******1 发帖数: 145 | 4 其他的感觉只能利用circular array然后更新count的时候刷新各个时段的k most freq
word了 |
p*****2 发帖数: 21240 | 5
storm streaming怎么搞比较好?
【在 n*******1 的大作中提到】 : storm streaming也行
|
n*******1 发帖数: 145 | 6 之前看内部讲座的时候提到了这个问题 google下ucsb的 space saving algorithm |
c***z 发帖数: 6348 | 7 min heap + max heap, forgot the details...
【在 f*******w 的大作中提到】 : infinite stream of words, return the K most frequent words in the : last minute/hour/day : 考了下古好像没什么太好的方法啊……
|
n*******1 发帖数: 145 | 8 max heap + min heap 我记得是stream找出中位数还是中值的用法
【在 c***z 的大作中提到】 : min heap + max heap, forgot the details...
|
f*******w 发帖数: 1243 | 9
这个不错,多谢多谢
【在 n*******1 的大作中提到】 : 之前看内部讲座的时候提到了这个问题 google下ucsb的 space saving algorithm
|
f*******w 发帖数: 1243 | 10
两heap只能用来找median吧?
【在 c***z 的大作中提到】 : min heap + max heap, forgot the details...
|