由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - 准备面试篇,无干货
相关主题
Google team match求助这个周末wwzz和zhaoce大牛来谈谈kafka吧?
面试准备和经验三星samsung创新部门招大数据工程师
究竟怎么回答System Design问题Pinterest陶涛:三个教训和三个发展选择 (转载)
唉, 这里得人都是太浮躁FYI, 做kafka的startup confluent刚成立
有没有大牛给比较一下mongodb和cassandra?Linkedin 面经
我的找工作经历一个小公司的面经
想想马工真可粘,听说Hadoop 2.0转型以后大家的知识都陈旧了Uber总部Big Data / 大数据组急招engineers
F家哪个组比较好?领英 昂赛 已挂
相关话题的讨论汇总
话题: 面试话题: design话题: 之前话题: 很多话题: 东西
进入JobHunting版参与讨论
1 (共1页)
b*****n
发帖数: 618
1
首先,无干货,可略过。
其次,我的经历不一定对所有人适用,也不是说我这么做就是对的,我工作时间也不长
所以有些问题看的也肤浅,主要目的是抛砖,一不小心又码字码多了,有耐心的同学可
以看看,欢迎指正和建议。
######################################
###
再说一下我的背景,既然很多人感兴趣,但是再细节就没有了。。
北美cs top25水校ms不到两年
之前在一只湾区的三哥驴(非L),版上已经有人猜出来了
做的东西还算可以,大数据的infra
######################################
###
除了刷题之外的准备。。
真正开始准备找工作是半年之前,我相信我在的驴比版上大部分公司都忙,所以开始的
时候进度比较慢,最开始的时候并没有主要刷题,而是列了一些我觉得必须要了解到一
定程度的system和framework来学习,我花了大概三个月时间来看一些paper,
opensource project的文档,presentation,source code和engineering blog。因为
工作中都在用,所以其实没有非常痛苦,但是尽量从design的角度来看问题会学到更多
东西,很多时候问问自己别人为什么要这样做,再结合自己真正的经历会收获很多。这
段时间也是自己对整个knowledge base查缺补漏的重要时间,只要看到不是很理解的概
念基本上都要查清楚,design很多时候其实是考察你的knowledge base和基本功是不是
扎实,没有knowledge base是很难做好design。
后面我还专门花时间来看跟Java concurrency有关的内容,joshua bloch的那本书我看
了一遍,然后又看了一遍Java concurrent library里面几个经典的数据结构的实现,
这个我觉得对我的帮助非常之大,很多东西以前模模糊糊突然会变得清楚很多,理解了
别人是怎么实现的,其实也能学会很多时候各种常见的优化是怎么做的。甚至很多
concurrency design和实现的技巧都是在这里学到的,比如之前不知道IntAccumulator
,AtomicIntArray,再比如我们都知道blockingqueue简单来说怎么实现,但是Java的
LinkedBlockdingQueue其实比较精巧,throughput较高,然后再跟之前接触过的
disruptor queue做比较,总结下来现在无非就是从最早的compareset busy wait浪费
cpu再到用wait condition节省cpu再到compareset busy wait浪费cpu但是提供更好的
throughput。另外就是直接对memory进行volatile读操作可以在很多时候节省读的时候
的锁。新的concurrenthashmap大量用到了这些,其实也提供了很多在做concurrent的
题目的时候一些重要的优化的方法。
做完这些事情之后本来想把Kafka的源码再读一下,但是时间不够了,虽然之前design
还是大体有些了解,但是我觉得hadoop,storm,kafka,Hbase,Cassandra这几个非常
典型的framework是我面试中必然要非常了解的东西,之前接触Kafka并不是非常多,所
以特意又把Kafka的paper和design doc研读了一下,然后又看了大量的其它公司的
engineering blog来了解别人都在做什么,都有什么问题。
之前没有做过很多跟web service相关的东西,所以这个类型的东西还是要看一下,
thanks god,版上有位F的大牛分享了很多有用的资料,有关最经典的几个系统的
design和实现,跟F相关的网上能找到的视频我基本上都看过一遍,文档我也都看过一
遍,基本上类似的问题都能用相同的原则来解决。
有些同学说design没有经验搞不定, 这个也对也不完全对,没有搞过确实缺乏第一手
资料,会不知道可能会出现哪些问题,但是不代表最常见的问题你没有其它途径可以知
道,大家对于各个系统的改进都是基于现有系统出现的常见问题,没做过可以,但是不
能作为不会做的借口,想要了解别人是怎么做的不是一件很难的事情。现在大部分常见
的系统整体来说都是大同小异,有一些最根本的原则其实大家都在遵循,然后区别往往
是针对不同use case的个别的优化。
所以这里我觉得比较有用的准备方法是,在弄明白一个design之前,先要做好几个准备
1. 先把一个process或者一个系统是怎么工作的搞清楚,这里是指,design一个
service需要cpu,memory,disk,network等等很多component协调工作,这些东西分别
都在什么时候用到,为什么要有这些东西,分别有什么特点。
相信大家都很熟悉有一篇文章叫做The numbers eveyone should know,在没有这篇文
章基础上的design都是瞎扯。
2. 要清楚这个design到底是为了解决什么问题,use case是什么,design一个系统根
本上讲是为了解决一个存在的problem,这个problem会有general的要求,比如latency
,比如throughput,比如load,比如哪种操作比较频繁,比如有没有consistency要求
,是不是reactive,是不是需要highly available,等等等等,这样跟第1点相结合才
能明白瓶颈可能在哪里,哪些东西可以tradeoff,进而才会有design的solution
3. knowledge base的储备要尽量够,操作系统,distributed system,concurrency这
些东西很难啃,我也曾经自学过几个大学的distributed system公开课,很多同学想绕
过这些走捷径,但是越难的东西就越有价值。知识量不够不是问题,看一点补充一点,
只要能坚持下来,到了一个时间点基本上还是可以有质变的。
所有的套路都是建立在这些东西基础之上,慢慢总结下来就会明白,在什么情况下可以
怎么做来解决什么样的问题。很多时候不需要你自己去想新的solution,但是对于现有
的solution能够做到灵活运用也不是一件很简单的事情。
简而言之,就是靠平时积累打好知识的基础+多偷学别人现有的东西+自己多总结多站
在解决问题的角度来思考,而不仅仅把这些当作面试题。
另外,我觉得就准备一般面试而言,版上有两大神贴,这两大神贴里面的内容相当的赞
,而且我也完完整整的读了所有的内容,这两大神贴现在还在第一页上
1. 就是beidapig大牛的总结贴
2. 就是另一个facebook大牛的总结经验内推贴
我对web service这一块的总结基本上就靠这两个帖子里面的内容,所以特别感谢这两
位。
以上这些事情其实工作之后断断续续一直都在做,但是集中精力做大概是持续了四个月
时间。
然后我觉得需要开始集中强化一下算法和coding。
######################################
###
有关算法coding:
在之前一个帖子说过了,LC+本版过去半年的面经。
不好意思,我不太擅长把东西整理的很有条理,所以基本上现在这些东西还是处于只有
我一个人能明白是什么的状态,非常之乱所以不好意思献丑。
但是我这里想说的是,总结的结果没有那么重要,过程才是最重要的,如果你看别人面
经的目的就是为了明白这几道题目或者期望面试碰到原题,我觉得面经是看不完的。这
个版上的资源非常之丰富,其实都不需要完全消化就能很容易拿到offer。
看一道题目就理解一道题目而且能够跟之前类似的问题融汇起来才是目的,其实看完版
上半年的面经并没有那么难,我这件事情坚持了一个多月时间,每天晚上看四,五个小
时,每个帖子每道题目,所有的回帖,都仔仔细细看过,这是我感觉算法突飞猛进的一
个重要时间段。
还有现在很多面试的很多题目不是偏向于算法而是coding的基本功,这个没办法就是多
练习,越是麻烦不好写的题目越是要多练习,其实都有规律可以遵循。
版上的难题我一个都没有遇到,我觉得LC中等到中等偏上难度的题目应该是大部分面试
的平均水平,花费大量时间在某些难题上面不一定有意义,还不如把基础打的更佳牢固
些。如果你面试中被问到难题,基本说明面试官在面试前就对你不是非常认可,需要用
一些比较难的题目来考察你。
我本身也面过不少candidates,所以我相信这个是大部分面试官常见的思路,其实真实
的事情是很多时候面试官想让你过你就能过,不想让你过你怎么样也过不了。面试不是
考试,不是题做出来就能100分,况且有很多题目都没有评分标准。
所以我说,刷题只是整个面试过程中最最基本的部分,只是必要的一个条件,远远不是
全部,如果能力够了刷题刷的不好也照样拿offer,大家互相什么水平随便聊两句都知
道个差不多,并不是所有人都喜欢面算法面刷题。
######################################
###
后面就真正进入面试的阶段,然后为了心无旁骛破釜沉舟我把之前没用的假期都用了,
然后开始全职专心致志搞。
面试的时候我的策略是先面练手的公司,然后中间状态最好的时候面最想去的公司,最
后再冲击难一点的hot preipo,不过发现面试的时间基本上自己也说了不算,之前做好
的计划基本没用。
最后三个周我基本上没有太刷题,最多就是看看之前掌握的感觉不是特别好的内容,然
后随便东戳一下西戳一下看看新的帖子,每天再练习两个设计题目,如果需要保持手感
就手写几道题目。每个公司onsite之前我还会把glassdoor上的面经浏览一下,主要是
为了心里有数,不会紧张。
所有的onsite基本上都在最后的两个周时间,这段时间比较艰难。
有关其他:
相比刚毕业的时候,这次找工作还是有一些感触比较深的地方:
1。简历非常重要,即使是去面FG这种大公司,很多时候面试结果在真正面之前就决定
了大半,如果简历还拿得出手自己对做的东西非常熟,有很大加成,所以请大家还是要
刷刷简历,好好准备。我有好几次都是聊简历相关的东西一轮面试就糊弄过去了,面试
官一般也不会为难。
2。找工作请找靠谱的朋友内推和找目标公司的recruiter,recruiter大部分是非常帮
忙的,所以请在一开始的时候对他们好一点,他们如果觉得你有戏会尽力帮你拿到
offer。recruiter在面试中起到的作用可以非常大,他们帮你安排面试官,他们可以看
到你的feedback,他们甚至可以有比较好的私人关系帮你match好的组,所以,在拿到
offer之前,注意是之前,装装孙子没有坏处。拿到offer之后主动权就在你自己手里了
,大局已定后双方的地位会互换,negotiate offer这个环节其实就一条。。。有
compete offer你就牛逼,没有你就。。。
3。面试过程也是不断学习的一个过程,这也是我为什么拼了命也要面这么多公司的一
个原因,因为我想多知道一些细节别的公司是怎么做的,所以面试的时候不要担心大胆
问,很多问题都是他们要解决的真实存在的问题,也是你将来可能会碰到的问题,如果
面下来10个公司只是这些总结下来的东西已经可以帮你再搞定一个面试了
4。另一个我觉得很有帮助的是有一群志同道合的朋友和能够指点自己的大腿,在整个
工作过程中我觉得从我的同事身上学到了很多很多东西,帮助很大,这点我不得不赞一
下我之前的驴的所有中国人,可能因为都被三哥压迫所以大家特别团结,平时对于各种
技术问题的交流都很到位,没有人会有所保留。现在我那一拨的人基本走的差不多了,
我算走的比较晚的,一般都是越牛的人走的越早,我最终的offer在所有人里面也就是
个中等水平吧。
5。运气,很重要,同样的人换一个环境可能是完全不同的结果。我之前问过一个大牛
找工作最重要的是什么,曰:运气。现在我很相信这个。。。
All in all,我不是牛人,我不是国内top20毕业也不是北美top20毕业,我本科也不是
学cs的,但是我特别相信版上之前一位前辈的话,大家能来到美国读一个decent学位说
明大家的智商都没任何问题,很多时候结果怎样只取决于自己的决心和毅力有多强大。
只要肯努力,结果就不会太差。
m******g
发帖数: 621
2
马上上来顶大神。
算法部分,楼主有没有参考一些书籍?还是只搞了LC和面经
再次恭喜楼主
A*******e
发帖数: 2419
3
天道酬勤。机遇偏爱有准备的头脑。

【在 b*****n 的大作中提到】
: 首先,无干货,可略过。
: 其次,我的经历不一定对所有人适用,也不是说我这么做就是对的,我工作时间也不长
: 所以有些问题看的也肤浅,主要目的是抛砖,一不小心又码字码多了,有耐心的同学可
: 以看看,欢迎指正和建议。
: ######################################
: ###
: 再说一下我的背景,既然很多人感兴趣,但是再细节就没有了。。
: 北美cs top25水校ms不到两年
: 之前在一只湾区的三哥驴(非L),版上已经有人猜出来了
: 做的东西还算可以,大数据的infra

m******g
发帖数: 621
4
楼主这个干货满满啊,太谦虚了
m*********5
发帖数: 7
5
厉害厉害,这些内容不仅对面试,对长期的技术提高也很有帮助啊,请问提到的
facebook大牛的总结经验内推贴具体指哪篇啊~

【在 b*****n 的大作中提到】
: 首先,无干货,可略过。
: 其次,我的经历不一定对所有人适用,也不是说我这么做就是对的,我工作时间也不长
: 所以有些问题看的也肤浅,主要目的是抛砖,一不小心又码字码多了,有耐心的同学可
: 以看看,欢迎指正和建议。
: ######################################
: ###
: 再说一下我的背景,既然很多人感兴趣,但是再细节就没有了。。
: 北美cs top25水校ms不到两年
: 之前在一只湾区的三哥驴(非L),版上已经有人猜出来了
: 做的东西还算可以,大数据的infra

j**********3
发帖数: 3211
6
mark
t**r
发帖数: 3428
7
膜拜豆包大牛!谢了
A*******e
发帖数: 2419
8
几个问题:
joshua bloch的那本书,是哪本?
F的大牛分享了很多有用的资料,是哪篇?
http://www.cs.cornell.edu/projects/ladis2009/talks/dean-keynote
另外我记得以前半海大牛也发过系统设计贴。

【在 A*******e 的大作中提到】
: 天道酬勤。机遇偏爱有准备的头脑。
t**r
发帖数: 3428
9
java concurrency那本。

【在 A*******e 的大作中提到】
: 几个问题:
: joshua bloch的那本书,是哪本?
: F的大牛分享了很多有用的资料,是哪篇?
: http://www.cs.cornell.edu/projects/ladis2009/talks/dean-keynote
: 另外我记得以前半海大牛也发过系统设计贴。

b*****n
发帖数: 618
10
Java Concurrency in Practice
这本书应该很有名吧
F大牛的那个帖子我貌似找不到了,容我再找找。。

【在 A*******e 的大作中提到】
: 几个问题:
: joshua bloch的那本书,是哪本?
: F的大牛分享了很多有用的资料,是哪篇?
: http://www.cs.cornell.edu/projects/ladis2009/talks/dean-keynote
: 另外我记得以前半海大牛也发过系统设计贴。

相关主题
我的找工作经历这个周末wwzz和zhaoce大牛来谈谈kafka吧?
想想马工真可粘,听说Hadoop 2.0转型以后大家的知识都陈旧了三星samsung创新部门招大数据工程师
F家哪个组比较好?Pinterest陶涛:三个教训和三个发展选择 (转载)
进入JobHunting版参与讨论
A*******e
发帖数: 2419
11
这书我有,只记得一个作者Brian Goetz,汗。
F那篇听起来很有用啊。有备份吗?

【在 b*****n 的大作中提到】
: Java Concurrency in Practice
: 这本书应该很有名吧
: F大牛的那个帖子我貌似找不到了,容我再找找。。

a***u
发帖数: 383
12
MARK
J*******o
发帖数: 741
13
受益匪浅,谢谢
b*****n
发帖数: 618
14
如果是刷题的话,主要就是这两块
如果是算法知识的话,正常的教科书也多少要看点。。
我本来计划上princeton的algorithm 1和2 但最后也没有时间了。
上学的时候基本经典算法书还是都读过也做过习题的,
比如CLRS,比如segwick那本Java的算法书
LC之前的每道题目的解法的总结其实写的挺好的,不过这个我上次找工作的时候已经都
看过了这次就没有专门去看。

【在 m******g 的大作中提到】
: 马上上来顶大神。
: 算法部分,楼主有没有参考一些书籍?还是只搞了LC和面经
: 再次恭喜楼主

s*******g
发帖数: 689
15
大神你说的F家大牛那篇面经的标题是什么啊?

【在 b*****n 的大作中提到】
: 如果是刷题的话,主要就是这两块
: 如果是算法知识的话,正常的教科书也多少要看点。。
: 我本来计划上princeton的algorithm 1和2 但最后也没有时间了。
: 上学的时候基本经典算法书还是都读过也做过习题的,
: 比如CLRS,比如segwick那本Java的算法书
: LC之前的每道题目的解法的总结其实写的挺好的,不过这个我上次找工作的时候已经都
: 看过了这次就没有专门去看。

b*****n
发帖数: 618
16
那位大牛貌似把原帖删了,但是我有备份的内容,透露出来应该不会有问题吧。。
2) design
解这种题是个*交流*的过程,或者说是给出方案然后获取反馈的不断循环的过程。
一般的流程:
首先你要问清楚requirement;
然后可以讲一下high level architecture,就是分成哪几个component,互相之间如果
interact,在白板上画一画;
之后面试官可能会让你深入某个component detail讨论;
也有可能变换requirement让你重新设计
另外,f家还喜欢让你估算机器之类的,做一些back-of-envelopme calculation。所以
最好对一些计算机相关的基本常数,fb的用户量等等有个大概的了解。
准备的时候建议看看fb的design高频题。一方面有可能面试的时候刚好碰到这几个
topic,另一方面其实很多design都是相通的。
之前有个帖子讲这个,原帖已经被删了,这儿有个备份http://blog.csdn.net/sigh1988/article/details/9790337
另外补充一点我收集的材料
a) 首先你可以从整体上了解一下facebook的architecture
http://www.quora.com/Facebook-Engineering/What-is-Facebooks-arc
http://www.ece.lsu.edu/hpca-18/files/HPCA2012_Facebook_Keynote.
http://www.quora.com/Facebook-Engineering/What-have-been-Facebo
除了下面给出的一些资料,fb engineering page里还有很多不错的内容
https://www.facebook.com/Engineering
b) news feed
这里有个talk
http://www.infoq.com/presentations/Facebook-News-Feed
对应的slides
http://readme.skplanet.com/wp-content/uploads/2012/11/0-3_Faceb
还有一些quora上的讨论
http://www.quora.com/Activity-Streams/What-are-the-scaling-issu
http://www.quora.com/What-are-best-practices-for-building-somet
http://www.quora.com/What-is-the-best-storage-solution-for-buil
c) facebook chat
这里有两个notes,其中第二个里面还有相应的tech talk links
https://www.facebook.com/notes/facebook-engineering/facebook-chat/
14218138919
https://www.facebook.com/notes/facebook-engineering/chat-stability-and-
scalability/51412338919
d) typeahead search & graph search
关于typeahead search的tech talk和notes
https://www.facebook.com/video/video.php?v=432864835468
https://www.facebook.com/note.php?note_id=365915113919
https://www.facebook.com/note.php?note_id=389105248919
关于graph search的paper, tech talk, notes。其中paper很值得一看。
http://db.disi.unitn.eu/pages/VLDBProgram/pdf/industry/p871-cur
https://newsroom.fb.com/Photos-and-B-Roll/4362/Graph-Search-Whiteboard
https://www.facebook.com/note.php?note_id=10151240856103920
https://www.facebook.com/note.php?note_id=10151347573598920
https://www.facebook.com/note.php?note_id=10151361720763920
https://www.facebook.com/note.php?note_id=10151432733048920
https://www.facebook.com/note.php?note_id=10151755593228920
e) facebook messages
两个tech talks
http://www.youtube.com/watch?v=XAuwAHWpzPc
http://www.infoq.com/presentations/HBase-at-Facebook
以及eng notes
https://www.facebook.com/note.php?note_id=10150148835363920
https://www.facebook.com/note.php?note_id=10150162742108920
f) photo storage
相关的papers和notes
https://www.usenix.org/conference/osdi10/finding-needle-haystack-facebooks-
photo-storage
https://www.usenix.org/legacy/events/osdi10/tech/full_papers/Beaver.pdf
https://www.usenix.org/legacy/events/osdi10/tech/slides/beaver.pdf
https://www.facebook.com/note.php?note_id=76191543919
g) social graph data store
相关的note, video, paper
https://www.facebook.com/notes/facebook-engineering/tao-the-power-of-the-
graph/10151525983993920
https://www.usenix.org/conference/atc13/technical-sessions/presentation/
bronson
http://www.cs.cmu.edu/~pavlo/courses/fall2013/static/papers/117
h) tiny URL
这里有一些讨论
http://n00tc0d3r.blogspot.com/2013/09/big-data-tinyurl.html
http://stackoverflow.com/questions/742013/how-to-code-a-url-sho
http://stackoverflow.com/questions/3376163/what-are-the-things-
i) POI
参考这里
http://www.slideshare.net/mmalone/scaling-gis-data-in-nonrelati
http://www.mitbbs.ca/article_t/JobHunting/32476139.html

【在 A*******e 的大作中提到】
: 这书我有,只记得一个作者Brian Goetz,汗。
: F那篇听起来很有用啊。有备份吗?

A*******e
发帖数: 2419
17
赶紧备份,多谢。

【在 b*****n 的大作中提到】
: 那位大牛貌似把原帖删了,但是我有备份的内容,透露出来应该不会有问题吧。。
: 2) design
: 解这种题是个*交流*的过程,或者说是给出方案然后获取反馈的不断循环的过程。
: 一般的流程:
: 首先你要问清楚requirement;
: 然后可以讲一下high level architecture,就是分成哪几个component,互相之间如果
: interact,在白板上画一画;
: 之后面试官可能会让你深入某个component detail讨论;
: 也有可能变换requirement让你重新设计
: 另外,f家还喜欢让你估算机器之类的,做一些back-of-envelopme calculation。所以

m******g
发帖数: 621
18
谢谢大牛,祝大牛在G日进斗金,哈哈

【在 b*****n 的大作中提到】
: 如果是刷题的话,主要就是这两块
: 如果是算法知识的话,正常的教科书也多少要看点。。
: 我本来计划上princeton的algorithm 1和2 但最后也没有时间了。
: 上学的时候基本经典算法书还是都读过也做过习题的,
: 比如CLRS,比如segwick那本Java的算法书
: LC之前的每道题目的解法的总结其实写的挺好的,不过这个我上次找工作的时候已经都
: 看过了这次就没有专门去看。

i*****d
发帖数: 962
19
牛帖mark. 楼主好人, 恭喜拿到大offer啊
c******y
发帖数: 3269
20
zan LZ, very encouraging
相关主题
FYI, 做kafka的startup confluent刚成立Uber总部Big Data / 大数据组急招engineers
Linkedin 面经领英 昂赛 已挂
一个小公司的面经请问个公司选组的问题:Hbase还是Kafka??
进入JobHunting版参与讨论
T*******e
发帖数: 4928
21
同感。狂赞。

【在 A*******e 的大作中提到】
: 天道酬勤。机遇偏爱有准备的头脑。
l**s
发帖数: 421
22
thx for sharing
w***y
发帖数: 148
23
mark
i**********g
发帖数: 758
24
zan!
half year, about 4-5 hours everyday .

【在 b*****n 的大作中提到】
: 首先,无干货,可略过。
: 其次,我的经历不一定对所有人适用,也不是说我这么做就是对的,我工作时间也不长
: 所以有些问题看的也肤浅,主要目的是抛砖,一不小心又码字码多了,有耐心的同学可
: 以看看,欢迎指正和建议。
: ######################################
: ###
: 再说一下我的背景,既然很多人感兴趣,但是再细节就没有了。。
: 北美cs top25水校ms不到两年
: 之前在一只湾区的三哥驴(非L),版上已经有人猜出来了
: 做的东西还算可以,大数据的infra

j********l
发帖数: 325
25
厉害呀,楼主也是学了好多好多东西
w***y
发帖数: 6251
26
多谢大牛啊,收藏了好好学习
l**o
发帖数: 356
27
收藏
m******3
发帖数: 346
28
先赞再看!
H********n
发帖数: 99
29
Numbers everyone should know 只要大概知道就行,还是具体数字都基本上记下来,
面试中会用到么?
b*****n
发帖数: 618
30
个人认为这个是must,不是optional,我指的是每个number的数量级,不用具体多少精
确到小数点后面xx位。
面试中可能不会直接问你这些数字,但是这个是所有design的最根本的出发点。
比如你需要设计一个kv store能handle 1M qps, key,value都是长度大概是100byte的
blob,99percentile 1ms latency,假设只考虑single cluster。
没有上面那些number是根本无从下手来设计的,你怎么设计这个系统别人一看就知道你
有没有经验。

【在 H********n 的大作中提到】
: Numbers everyone should know 只要大概知道就行,还是具体数字都基本上记下来,
: 面试中会用到么?

相关主题
请帮忙看一下简历面试准备和经验
Senior Software Engineer @ NSFOCUS, Santa Clara, CA究竟怎么回答System Design问题
Google team match求助唉, 这里得人都是太浮躁
进入JobHunting版参与讨论
m******3
发帖数: 346
31
如果工作当中接触不到web相关的system design,有没有什么好的方法去提高呢?比如
你下面说的这个例子,怎么利用这些number来决定设计呢?有没有什么好的参考资料?
谢谢!

【在 b*****n 的大作中提到】
: 个人认为这个是must,不是optional,我指的是每个number的数量级,不用具体多少精
: 确到小数点后面xx位。
: 面试中可能不会直接问你这些数字,但是这个是所有design的最根本的出发点。
: 比如你需要设计一个kv store能handle 1M qps, key,value都是长度大概是100byte的
: blob,99percentile 1ms latency,假设只考虑single cluster。
: 没有上面那些number是根本无从下手来设计的,你怎么设计这个系统别人一看就知道你
: 有没有经验。

g**4
发帖数: 863
32
大牛一定要顶
G******n
发帖数: 572
33
Mark
e***i
发帖数: 231
34
好贴收藏!赞👍
S*********9
发帖数: 541
35
顶!赞!

【在 b*****n 的大作中提到】
: 首先,无干货,可略过。
: 其次,我的经历不一定对所有人适用,也不是说我这么做就是对的,我工作时间也不长
: 所以有些问题看的也肤浅,主要目的是抛砖,一不小心又码字码多了,有耐心的同学可
: 以看看,欢迎指正和建议。
: ######################################
: ###
: 再说一下我的背景,既然很多人感兴趣,但是再细节就没有了。。
: 北美cs top25水校ms不到两年
: 之前在一只湾区的三哥驴(非L),版上已经有人猜出来了
: 做的东西还算可以,大数据的infra

r*******n
发帖数: 3020
36
赞干货

【在 b*****n 的大作中提到】
: 首先,无干货,可略过。
: 其次,我的经历不一定对所有人适用,也不是说我这么做就是对的,我工作时间也不长
: 所以有些问题看的也肤浅,主要目的是抛砖,一不小心又码字码多了,有耐心的同学可
: 以看看,欢迎指正和建议。
: ######################################
: ###
: 再说一下我的背景,既然很多人感兴趣,但是再细节就没有了。。
: 北美cs top25水校ms不到两年
: 之前在一只湾区的三哥驴(非L),版上已经有人猜出来了
: 做的东西还算可以,大数据的infra

h*****a
发帖数: 1718
37
赞,写的非常好!

【在 b*****n 的大作中提到】
: 首先,无干货,可略过。
: 其次,我的经历不一定对所有人适用,也不是说我这么做就是对的,我工作时间也不长
: 所以有些问题看的也肤浅,主要目的是抛砖,一不小心又码字码多了,有耐心的同学可
: 以看看,欢迎指正和建议。
: ######################################
: ###
: 再说一下我的背景,既然很多人感兴趣,但是再细节就没有了。。
: 北美cs top25水校ms不到两年
: 之前在一只湾区的三哥驴(非L),版上已经有人猜出来了
: 做的东西还算可以,大数据的infra

v*******C
发帖数: 28
38
赞大牛!多谢分享! mark
b*****n
发帖数: 618
39
跪了,多谢大神

【在 h*****a 的大作中提到】
: 赞,写的非常好!
t****i
发帖数: 88
40
哪位大牛能展开说说怎么回答这个问题么?
我就属于完全没经验的,看着那些numbers,也不知道怎么去回答这个问题 汗
参考了一下这个 http://highscalability.com/blog/2011/1/26/google-pro-tip-use-back-of-the-envelope-calculations-to-choo.html
我只想到了下面这些
每个query需要的时间(这里还没想明白key,value 100byte 这个信息怎么用,似乎我
的计算就是考虑去read 100byte)
1. 10 ms/seek + 100Byte read / 30 MB/s = 10ms
2. So 每台机器每秒可以处理 100K queries
3. 100M qps的话 需要 1k机器
但是感觉很多信息都还没用到,网络传输那些numbers在这里怎么用? 还有“
99percentile 1ms latency”这个要求是如何去满足的?
相关主题
唉, 这里得人都是太浮躁想想马工真可粘,听说Hadoop 2.0转型以后大家的知识都陈旧了
有没有大牛给比较一下mongodb和cassandra?F家哪个组比较好?
我的找工作经历这个周末wwzz和zhaoce大牛来谈谈kafka吧?
进入JobHunting版参与讨论
g*****y
发帖数: 94
41
有没有人能够把这个facebook system design的内容再贴一份?这里面的链接都打不开
,万分感谢!

【在 b*****n 的大作中提到】
: 那位大牛貌似把原帖删了,但是我有备份的内容,透露出来应该不会有问题吧。。
: 2) design
: 解这种题是个*交流*的过程,或者说是给出方案然后获取反馈的不断循环的过程。
: 一般的流程:
: 首先你要问清楚requirement;
: 然后可以讲一下high level architecture,就是分成哪几个component,互相之间如果
: interact,在白板上画一画;
: 之后面试官可能会让你深入某个component detail讨论;
: 也有可能变换requirement让你重新设计
: 另外,f家还喜欢让你估算机器之类的,做一些back-of-envelopme calculation。所以

y****2
发帖数: 16
42
赞,非常好的资料!
p*****2
发帖数: 21240
43
lz真是下了很大功夫呀 厉害

【在 b*****n 的大作中提到】
: 首先,无干货,可略过。
: 其次,我的经历不一定对所有人适用,也不是说我这么做就是对的,我工作时间也不长
: 所以有些问题看的也肤浅,主要目的是抛砖,一不小心又码字码多了,有耐心的同学可
: 以看看,欢迎指正和建议。
: ######################################
: ###
: 再说一下我的背景,既然很多人感兴趣,但是再细节就没有了。。
: 北美cs top25水校ms不到两年
: 之前在一只湾区的三哥驴(非L),版上已经有人猜出来了
: 做的东西还算可以,大数据的infra

V**********i
发帖数: 82
44
强贴流明....

【在 b*****n 的大作中提到】
: 首先,无干货,可略过。
: 其次,我的经历不一定对所有人适用,也不是说我这么做就是对的,我工作时间也不长
: 所以有些问题看的也肤浅,主要目的是抛砖,一不小心又码字码多了,有耐心的同学可
: 以看看,欢迎指正和建议。
: ######################################
: ###
: 再说一下我的背景,既然很多人感兴趣,但是再细节就没有了。。
: 北美cs top25水校ms不到两年
: 之前在一只湾区的三哥驴(非L),版上已经有人猜出来了
: 做的东西还算可以,大数据的infra

p*****9
发帖数: 273
45
好帖mark
w*****5
发帖数: 75
46
强贴留名!
f**********e
发帖数: 288
J*******i
发帖数: 2162
48
mark
[发表自未名空间手机版 - m.mitbbs.com]
h******6
发帖数: 2697
49
mark
s********l
发帖数: 998
50
这篇要 mark~
写的很好~
相关主题
三星samsung创新部门招大数据工程师Linkedin 面经
Pinterest陶涛:三个教训和三个发展选择 (转载)一个小公司的面经
FYI, 做kafka的startup confluent刚成立Uber总部Big Data / 大数据组急招engineers
进入JobHunting版参与讨论
x****y
发帖数: 252
51
mark. Zan!
z*****5
发帖数: 72
52
谢谢lz分享经验!
c******n
发帖数: 91
53
mark
1 (共1页)
进入JobHunting版参与讨论
相关主题
领英 昂赛 已挂有没有大牛给比较一下mongodb和cassandra?
请问个公司选组的问题:Hbase还是Kafka??我的找工作经历
请帮忙看一下简历想想马工真可粘,听说Hadoop 2.0转型以后大家的知识都陈旧了
Senior Software Engineer @ NSFOCUS, Santa Clara, CAF家哪个组比较好?
Google team match求助这个周末wwzz和zhaoce大牛来谈谈kafka吧?
面试准备和经验三星samsung创新部门招大数据工程师
究竟怎么回答System Design问题Pinterest陶涛:三个教训和三个发展选择 (转载)
唉, 这里得人都是太浮躁FYI, 做kafka的startup confluent刚成立
相关话题的讨论汇总
话题: 面试话题: design话题: 之前话题: 很多话题: 东西