[网flix]面经 - JobHunting版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

JobHunting版 - [网flix]面经

相关主题
● 那道求两大文件交集的G题	● [hortonworks面经] senior hadoop engineer
● G家mapreduce一道题	● G家电面题
● G家面经，求bless	● 关于学习 Hadoop , 求指点
● 一道大数据题，求最优解。	● 请问如何准备data scientist工作面试？
● 请教可以在线练习 map reduce 的地方？	● 还有一周onsite，怎么看Hadoop.The.Definitive.Guide效率最高？
● 简单map reduce mean median，傻逼回答	● 问有没有mapreduce，hadoop，hbase经验怎么处理？
● Amazon组选择：EC2还是Elastic MapReduce	● SDE position available in a New Jersey based data center networking startup
● hadoop面试和学习总结	● 前员工追忆百度乱象：上下异心狼性压制人性（转载）

相关话题的讨论汇总
话题: courseid话题: hadoop话题: group话题: mapred话题: studentid

进入JobHunting版参与讨论

1

(共1页)

H***e 发帖数: 476	1 1。很多hadoop相关的问题，mapred整个流程，碰到过的出现的问题，设计有什么flaws , hadoop和relational db的比较; speculative execution, 我知道这个机制，但是没有跟名字对上号..就说没听说过。 2。mapreduce怎么实现select count group by; 如何一次mapred实现两个group by (stduentId, courseId) select count * from table group by studentId; select count * from table group by courseId; 3。两个element加起来target的经典题 4。实现一个Boundedqueue,threadsafe,并且最佳化性能。都答出来了，但是hadoop那些模糊问题的就答得不好。
d********w 发帖数: 363	2 赞，关于第二题在hadoop中有个叫secondary sort，在parittion时候可以使得键值组成的key，同样的键在同一个分区中。这样行么 map: emit(pair, value> partition: super.partition(key.get(1)) flaws 【在 H**e 的大作中提到】 : 1。很多hadoop相关的问题，mapred整个流程，碰到过的出现的问题，设计有什么flaws : , hadoop和relational db的比较; speculative execution, 我知道这个机制，但是没 : 有跟名字对上号..就说没听说过。 : 2。mapreduce怎么实现select count group by; 如何一次mapred实现两个group by : (stduentId, courseId) : select count from table group by studentId; : select count * from table group by courseId; : 3。两个element加起来target的经典题 : 4。实现一个Boundedqueue,threadsafe,并且最佳化性能。 : 都答出来了，但是hadoop那些模糊问题的就答得不好。
H***e 发帖数: 476	3 我就说了最简单的，每次map emit两次，一次key studentID value courseId 一次key course, value student, 最后都柔和在一个文件里了，再做些post processing。他说good,也没说有问题. 【在 d********w 的大作中提到】 : 赞，关于第二题在hadoop中有个叫secondary sort， : 在parittion时候可以使得键值组成的key，同样的键在同一个分区中。这样行么 : map: : emit(pair, value> : partition: : super.partition(key.get(1)) : : flaws
w**z 发帖数: 8232	4 面的啥职位啊？ flaws 【在 H**e 的大作中提到】 : 1。很多hadoop相关的问题，mapred整个流程，碰到过的出现的问题，设计有什么flaws : , hadoop和relational db的比较; speculative execution, 我知道这个机制，但是没 : 有跟名字对上号..就说没听说过。 : 2。mapreduce怎么实现select count group by; 如何一次mapred实现两个group by : (stduentId, courseId) : select count from table group by studentId; : select count * from table group by courseId; : 3。两个element加起来target的经典题 : 4。实现一个Boundedqueue,threadsafe,并且最佳化性能。 : 都答出来了，但是hadoop那些模糊问题的就答得不好。

1

(共1页)

进入JobHunting版参与讨论

相关主题
● 前员工追忆百度乱象：上下异心狼性压制人性（转载）	● 请教可以在线练习 map reduce 的地方？
● 大家如何选择offer呢？	● 简单map reduce mean median，傻逼回答
● 想想马工真可粘，听说Hadoop 2.0转型以后大家的知识都陈旧了	● Amazon组选择：EC2还是Elastic MapReduce
● 不懂map reduce去面flg会怎样	● hadoop面试和学习总结
● 那道求两大文件交集的G题	● [hortonworks面经] senior hadoop engineer
● G家mapreduce一道题	● G家电面题
● G家面经，求bless	● 关于学习 Hadoop , 求指点
● 一道大数据题，求最优解。	● 请问如何准备data scientist工作面试？

相关话题的讨论汇总
话题: courseid话题: hadoop话题: group话题: mapred话题: studentid

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)