由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - 一道题
相关主题
问两个Palindrome的老题给出5个数字和加减乘除4个符号求最大值
做一下common prefix in sorted string arrays求问一道面试题
Interleave Strings那个题目有O(n)时间 O(1)空间算法么?问一道uber onsite题目
关于 unique paths,总是过不了 OJ, 请牛牛们帮忙看看~~~先谢过。。。问一道最近的onsite题
搞了小半个月,leetcode还有20题面试题
Leetcode-010: Regular Expression Match (DP Solution)这么热闹, 我也报Google offer
fb电面面经Amazon组选择:EC2还是Elastic MapReduce
Wildcard Matching 和 Regular Expression Matching 区别是什么问个问题 (large-scale question)
相关话题的讨论汇总
话题: find话题: 道题话题: unicode话题: question话题: charaters
进入JobHunting版参与讨论
1 (共1页)
p*****o
发帖数: 1285
1
某家on-site的一道题。
Find the most frequent character in a string.
Data: strings are composed of Unicode charaters, stored in 10 sets of 5GB
files on 10 different servers each with 2GB of memory.
Constraints: network communication is expensive.
Question: find the best algorithm.
m*****g
发帖数: 226
2
hadoop word count?
Z*****Z
发帖数: 723
3
MapReduce的思路吧,10台机器,每个负责数一个区间内的数。
基本算法就是每个机器读自己的文件,然后发送每个字符到相应的机器上。
要是想save network communication cost,可以每台机器把要发送的字符cache起来,
这样每个机器生成10个文件,然后把其中的9个发送到相应的主机上去。

【在 p*****o 的大作中提到】
: 某家on-site的一道题。
: Find the most frequent character in a string.
: Data: strings are composed of Unicode charaters, stored in 10 sets of 5GB
: files on 10 different servers each with 2GB of memory.
: Constraints: network communication is expensive.
: Question: find the best algorithm.

1 (共1页)
进入JobHunting版参与讨论
相关主题
问个问题 (large-scale question)搞了小半个月,leetcode还有20题
Amazon试题算法Leetcode-010: Regular Expression Match (DP Solution)
google on campus 面试多久出结果+面经fb电面面经
问一道Google面试题Wildcard Matching 和 Regular Expression Matching 区别是什么
问两个Palindrome的老题给出5个数字和加减乘除4个符号求最大值
做一下common prefix in sorted string arrays求问一道面试题
Interleave Strings那个题目有O(n)时间 O(1)空间算法么?问一道uber onsite题目
关于 unique paths,总是过不了 OJ, 请牛牛们帮忙看看~~~先谢过。。。问一道最近的onsite题
相关话题的讨论汇总
话题: find话题: 道题话题: unicode话题: question话题: charaters