y**********0 发帖数: 86 | 1 还有一周多的时间onsite,准备看Hadoop.The.Definitive.Guide突击准备一下large-
scale system design。有没有大牛指点一下哪几章对面试来说比较重要? |
d********w 发帖数: 363 | 2 为啥那这本书来准备面试呢?如果你没有hadoop的经验,也不用看这些的。
如果你的职位要求里面确实有hadoop,可以去检查或者搜索一下以下问题
1. mapreduce的几个阶段
2. pig, hive的大致设计和比较,(结合sql写法)
3. wordcount, terasort的mapreduce程序写法
4. hadoop在不同节点启动了那些服务
5. secondary sort, partition如何用
6. 什么是nosql,ACID跟BASE比较
7. hadoop的不足和最新改进(next generation)
8. HDFS的如何做到scalability和高可靠性
这些基本问题掌握后,可以找找资源,比如你提到那边书,GFS/MapReduce/BigTable
paper, hadoop summit 2012大会上的slides,youtube或者cloudera上面的hadoop视频
海量数据处理倒是经常会问到,比如如何在多台机器上找中位数,n个数找最大k个数,
搜索如何做索引,以前有个帖子专门总结过。
【在 y**********0 的大作中提到】 : 还有一周多的时间onsite,准备看Hadoop.The.Definitive.Guide突击准备一下large- : scale system design。有没有大牛指点一下哪几章对面试来说比较重要?
|
y**********0 发帖数: 86 | 3 多谢指点。我没有hadoop经验,面试的是G家,估计也不是一定要hadoop经验的。我是
看大家都在看这本书所以想看看这本书学习map-reduce的。有好的精简的map-reduce资
料适合突击的吗?你说的总结海量数据处理的帖子是不是这个?
http://www.mitbbs.com/article/JobHunting/32086341_0.html
【在 d********w 的大作中提到】 : 为啥那这本书来准备面试呢?如果你没有hadoop的经验,也不用看这些的。 : 如果你的职位要求里面确实有hadoop,可以去检查或者搜索一下以下问题 : 1. mapreduce的几个阶段 : 2. pig, hive的大致设计和比较,(结合sql写法) : 3. wordcount, terasort的mapreduce程序写法 : 4. hadoop在不同节点启动了那些服务 : 5. secondary sort, partition如何用 : 6. 什么是nosql,ACID跟BASE比较 : 7. hadoop的不足和最新改进(next generation) : 8. HDFS的如何做到scalability和高可靠性
|
d********w 发帖数: 363 | 4 对,就这个帖子,我之前面G家就一点没问道mapreduce, 他们不怎么care背景,就是要
算法好的。
【在 y**********0 的大作中提到】 : 多谢指点。我没有hadoop经验,面试的是G家,估计也不是一定要hadoop经验的。我是 : 看大家都在看这本书所以想看看这本书学习map-reduce的。有好的精简的map-reduce资 : 料适合突击的吗?你说的总结海量数据处理的帖子是不是这个? : http://www.mitbbs.com/article/JobHunting/32086341_0.html
|
y**********0 发帖数: 86 | 5 多谢了!
【在 d********w 的大作中提到】 : 对,就这个帖子,我之前面G家就一点没问道mapreduce, 他们不怎么care背景,就是要 : 算法好的。
|