如何找出top10的url? - JobHunting版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

JobHunting版 - 如何找出top10的url?

相关主题
● bioinformatics在工业界的职位？	● Amazon二面结束，求BLESS
● 谁能言简意赅解释下为什么page rank算法肯定converge	● 问一道Amazon的老题
● 第一次onsite挂了，求祝福&分享经验	● 分享面试题
● 最新克劳迪亚链接 20140609 (转载)	● 问一道题(4)
● 一道统计面试题	● 问一道题目
● 关于什么时候可以用贪心算法求找零问题	● start up 和上市公司，package total 近似改选哪个呢？
● 电话面经（Microsoft, Amazon, Google, ...)	● 求问Facebook最近招人情况？
● 请问有水资源方向的朋友吗？	● 最近有进twitter的吗。

相关话题的讨论汇总
话题: url话题: mcmc话题: top10

进入JobHunting版参与讨论

1

(共1页)

K*****k 发帖数: 430	1 一个大文件包含了上亿条url的记录，不能全部装入内存，如何找到top popular的10条？如果不需要exact的top 10, 什么方法可以最快找到近似的top 10?
y**********u 发帖数: 6366	2 min heap 【在 K*****k 的大作中提到】 : 一个大文件包含了上亿条url的记录，不能全部装入内存，如何找到top popular的10条 : ？如果不需要exact的top 10, 什么方法可以最快找到近似的top 10?
s******n 发帖数: 226	3 近似的话，sampling就好了，MCMC应该可以？
m**********r 发帖数: 122	4 But MCMC can be very slow. 【在 s******n 的大作中提到】 : 近似的话，sampling就好了，MCMC应该可以？

1

(共1页)

进入JobHunting版参与讨论

相关主题
● 最近有进twitter的吗。	● 一道统计面试题
● unidentified_title	● 关于什么时候可以用贪心算法求找零问题
● 发facebook两轮面经，求第三轮经验	● 电话面经（Microsoft, Amazon, Google, ...)
● Amazon 2nd Phone Interview	● 请问有水资源方向的朋友吗？
● bioinformatics在工业界的职位？	● Amazon二面结束，求BLESS
● 谁能言简意赅解释下为什么page rank算法肯定converge	● 问一道Amazon的老题
● 第一次onsite挂了，求祝福&分享经验	● 分享面试题
● 最新克劳迪亚链接 20140609 (转载)	● 问一道题(4)

相关话题的讨论汇总
话题: url话题: mcmc话题: top10

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)