g*****g 发帖数: 34805 | 1 弄个ConcurrentHashmap指向linked list不就完了。锁啥list. |
|
f*******s 发帖数: 182 | 2 我的面试也结束了 因为知道FLAG这类公司都会问到System Design的问题 所以这次面
试着重准备了一下 在这里分享给大家 如果有不对或者需要补充的地方 大家可以留言
这里说的System Design和OO Design不同 System Design在FLAG以及很多大公司中主要
是design scalable distributed systems 这里只讨论如何准备这种题目
== 入门 ==
对于0基础的同学们 下面的资料可以按顺序开始看
1. http://www.hiredintech.com/app#system-design
这是一个专门准备面试的网站 你只用关心system design部分 有很多的link后面会重
复提到 建议看完至少一遍
2. https://www.youtube.com/watch?v=-W9F__D3oY4
非常非常好的入门资料 建议看3遍以上!
这是1里面提到的资料 是Harvard web app课的最后一节 讲scalability 里面会讲到很
多基础概念比如Vertical scaling, Horizontal sca... 阅读全帖 |
|
f*******s 发帖数: 182 | 3 我的面试也结束了 因为知道FLAG这类公司都会问到System Design的问题 所以这次面
试着重准备了一下 在这里分享给大家 如果有不对或者需要补充的地方 大家可以留言
这里说的System Design和OO Design不同 System Design在FLAG以及很多大公司中主要
是design scalable distributed systems 这里只讨论如何准备这种题目
== 入门 ==
对于0基础的同学们 下面的资料可以按顺序开始看
1. http://www.hiredintech.com/app#system-design
这是一个专门准备面试的网站 你只用关心system design部分 有很多的link后面会重
复提到 建议看完至少一遍
2. https://www.youtube.com/watch?v=-W9F__D3oY4
非常非常好的入门资料 建议看3遍以上!
这是1里面提到的资料 是Harvard web app课的最后一节 讲scalability 里面会讲到很
多基础概念比如Vertical scaling, Horizontal sca... 阅读全帖 |
|
f*******r 发帖数: 976 | 4 多谢,总结得很好
我的面试也结束了 因为知道FLAG这类公司都会问到System Design的问题 所以这次面
试着重准备了一下 在这里分享给大家 如果有不对或者需要补充的地方 大家可以留言
这里说的System Design和OO Design不同 System Design在FLAG以及很多大公司中主要
是design scalable distributed systems 这里只讨论如何准备这种题目
== 入门 ==
对于0基础的同学们 下面的资料可以按顺序开始看
1. http://www.hiredintech.com/app#system-design
这是一个专门准备面试的网站 你只用关心system design部分 有很多的link后面会重
复提到 建议看完至少一遍
2. https://www.youtube.com/watch?v=-W9F__D3oY4
非常非常好的入门资料 建议看3遍以上!
这是1里面提到的资料 是Harvard web app课的最后一节 讲scalability 里面会讲到很
多基础概念比如Vertical scaling, Hori... 阅读全帖 |
|
f*******r 发帖数: 976 | 5 多谢,总结得很好
我的面试也结束了 因为知道FLAG这类公司都会问到System Design的问题 所以这次面
试着重准备了一下 在这里分享给大家 如果有不对或者需要补充的地方 大家可以留言
这里说的System Design和OO Design不同 System Design在FLAG以及很多大公司中主要
是design scalable distributed systems 这里只讨论如何准备这种题目
== 入门 ==
对于0基础的同学们 下面的资料可以按顺序开始看
1. http://www.hiredintech.com/app#system-design
这是一个专门准备面试的网站 你只用关心system design部分 有很多的link后面会重
复提到 建议看完至少一遍
2. https://www.youtube.com/watch?v=-W9F__D3oY4
非常非常好的入门资料 建议看3遍以上!
这是1里面提到的资料 是Harvard web app课的最后一节 讲scalability 里面会讲到很
多基础概念比如Vertical scaling, Hori... 阅读全帖 |
|
g*****g 发帖数: 34805 | 6 MySQL with a readonly replica. Front your DB with Memcached.
update
4 |
|
|
w**z 发帖数: 8232 | 8 web server 加机器就行了。 中间加memcache, 数据库sharding, 加slave.
如果可以放在aws, 加机器更方便,快速。过了突然加大的访问量,再把机器撤了 |
|
w**********a 发帖数: 10 | 9 这次换马还是挺成功的,面了n家拿了n个offer, 没有失手过。说说经验。
说女的去面试简单的我就呵呵了,这么说吧,我被面到的题肯定比我面别人的题(我的
驴子也是FLAG)难多了,特别是G家,一大半都是没见过的。不过不简单不等于没有优势
,这点还是要实事求是的。很明显的一点就是没感觉被阿三阴,所有的面试官都比较
reasonable。
刷题还是要好好刷,不要光追求刷leetcode的数量,还要追求质量。一道题多种解法都
试试看,吃吃透,这样才不枉费我们宝贵的时间。特别是骑驴找马的,你想想请假一天
都好几百刀,不fully ready就去面试太亏了。
设计题没有准备,主要是觉得准备了也没啥用。工作这么多年胡扯还是会的,
cassandra, memcache之类胡扯一通半小时也就过了。
至于各大公司的经验,G家我从面到拿offer是两周,F是一周,几个start up 是1到3天
不等,和公司size比较正相关。用offer互相催很明显会加快速度。
就这样了,祝大家好运! |
|
|
j********x 发帖数: 2330 | 11 实力极强谈不上。。。
“cassandra, memcache之类胡扯一通半小时”有这种心态的都是半桶水:一瓶不满半
瓶晃荡。。。 |
|
s*****r 发帖数: 43070 | 12 俺们锁男去面试,哪有人问你cassendra和memcache这些玩意,上来就是设计一个key
value系统,还要支持CAP和low latency,妈妈的,不让人活啊
PhD |
|
M*******a 发帖数: 1633 | 13 2爷请勿堆砌新名词,不如假设只能用amazon stack的东西来做,比如no sql的只有
dynamo DB+memcached,其他都要自己开发。 |
|
g*****g 发帖数: 34805 | 14 你可以用dynamo做数据库,memcached做session clustering。上面这个功能应该是很
容易完成的。用户每浏览一个东西可以写数据库一次,也可以等session timeout/
logout的时候一块写。前者更可靠一些,但是scalability不如后者,都是取舍。 |
|
y**********u 发帖数: 6366 | 15 来自主题: JobHunting版 - 秒杀设计题 redis主要是替代memcache或者当in-memory queue |
|
g*****g 发帖数: 34805 | 16 来自主题: JobHunting版 - 秒杀设计题 只要能放进内存,memcache和redis算是首选。couchbase我不熟不敢评论。
Session大,内存不足,或者session的数据重新产生的penalty很大,可以考虑C*,
Dynamo. 所有的设计都是取舍,没有一个什么都好的方案,看的是哪个更适合自己的应
用。 |
|
p*****p 发帖数: 379 | 17 这就没了?
流量是多少
ip/cookie/session based?
服务器架构是怎么样的?
这东西准备放在哪里?
有些什么现成的东西(memcached/redis...)? |
|
l*****a 发帖数: 14598 | 18 就是自己穷白话
充其量加点replication/partition/memcache等名词(其实也没用过)
能行吗
请各位面试官大大,hm说说 |
|
l*****a 发帖数: 14598 | 19 就是自己穷白话
充其量加点replication/partition/memcache等名词(其实也没用过)
能行吗
请各位面试官大大,hm说说 |
|
M******9 发帖数: 10 | 20 基本都面完了,前一段刚注册了一个帐号,上来发文,大概说下自己的经历,抛个砖头
,希望对大家有用,也祝愿大家都能找到满意的工作。有NDA就不说onsite具体题目了
,感觉也没什么必要说,会大概说说面到的知识点,可能比较乱,大家将就着看。
基本情况:fresh cs phd, 找的都是SE的工作,为啥不找教职或者research lab这里就
不讨论了. FLGT(2 offers, 1家withdraw, 1家简历被刷), startups UPASD(2 offers,
2家电面挂,1家没申请)
pros:背景还不错,都是top school, GPA高。。(fresh貌似公司还是会稍微看看这个)
cons: 没有intern经验是硬伤,PhD期间,上完课后代码写得不多
package还没开始谈,initial offer都差不多200k+的样子,大公司hr明确表示等我都
面完了可以谈, startup都是late stage, 股票都是十万分之5-10, 感觉不好谈。LD目
前在一家大公司,说其实先去大公司几年也不错,比较稳定,貌似股票refresh也可能
不错,work/life... 阅读全帖 |
|
M******9 发帖数: 10 | 21 基本都面完了,前一段刚注册了一个帐号,上来发文,大概说下自己的经历,抛个砖头
,希望对大家有用,也祝愿大家都能找到满意的工作。有NDA就不说onsite具体题目了
,感觉也没什么必要说,会大概说说面到的知识点,可能比较乱,大家将就着看。
基本情况:fresh cs phd, 找的都是SE的工作,为啥不找教职或者research lab这里就
不讨论了. FLGT(2 offers, 1家withdraw, 1家简历被刷), startups UPASD(2 offers,
2家电面挂,1家没申请)
pros:背景还不错,都是top school, GPA高。。(fresh貌似公司还是会稍微看看这个)
cons: 没有intern经验是硬伤,PhD期间,上完课后代码写得不多
package还没开始谈,initial offer都差不多200k+的样子,大公司hr明确表示等我都
面完了可以谈, startup感觉不好谈。LD目前在一家大公司,说其实先去大公司几年也
不错,比较稳定,貌似股票refresh也可能不错,work/life balance比较好。我自己是
想去startup, 但... 阅读全帖 |
|
D*********G 发帖数: 193 | 22 首先,facebook面试的时候不单独针对哪个组。
主要考察coding/system design/culture match(也就是看background是否接近)
所以你不用担心你要去面什么职位
面试之前,HR会根据你的background选面试官,这样保证你的面试官对你background比
较熟悉,这样你的culture match也不会有问题。
如果你感兴趣FB infra的话,我简单介绍如下
FB 的infra简单的分主要是两种:
1. infra infra, 提供运行facebook最基本的infra,包括
core: graph/TAO/memcache,mysql和各种DB
data:big data, Hadoop
service:provide tools for internal services
network: software-defined network
dev: development tools
2. service infra, facebook所有的大的feature都有自己单独的infra structure,例
如ads infra,s... 阅读全帖 |
|
D*********G 发帖数: 193 | 23 首先,facebook面试的时候不单独针对哪个组。
主要考察coding/system design/culture match(也就是看background是否接近)
所以你不用担心你要去面什么职位
面试之前,HR会根据你的background选面试官,这样保证你的面试官对你background比
较熟悉,这样你的culture match也不会有问题。
如果你感兴趣FB infra的话,我简单介绍如下
FB 的infra简单的分主要是两种:
1. infra infra, 提供运行facebook最基本的infra,包括
core: graph/TAO/memcache,mysql和各种DB
data:big data, Hadoop
service:provide tools for internal services
network: software-defined network
dev: development tools
2. service infra, facebook所有的大的feature都有自己单独的infra structure,例
如ads infra,s... 阅读全帖 |
|
g*****g 发帖数: 34805 | 24 Memcached is a typical case for No.4, and you can use consistent hashing to
minimize rehashing. |
|
g*****g 发帖数: 34805 | 25 1. 大文件做hash是会conflict的,所以hash只能看成一个bucket,key还是得句子本身
。也可以把hash+sentence做两次比较的Key。但这都不是重点。用Memcached, Redis一
类的结构,可以hash到K个结点上,维护个计数器,超过2可以不更新。最后各个节点把
自己查一遍就行。O(N/K)的时间。
相似句子也相似,把句子删除任意一个单词的句子都放进去,key后加个链表来表示相
似。
2. 相当一个完美哈希,节点的range就是个平均分段就行,其他的跟1没啥区别。可以
把分段后的所有可能都扔内存里然后挨个删,最后不剩几个排序时间接近O(1)。
这两道都是MapReduce. |
|
t*****a 发帖数: 106 | 26 原题
design photo reference counting system at fb scale
感觉这题主要是要解决high volume concurrent writing. 我想的是如果要scaling up
, 在每个Appserver 上对每个photo加一个counter,然后每隔T时间传到一个aggregator
把所有与目标相关的counter相加,然后update DB和Memcached. 一些细节还没想清楚
,求讨论。 |
|
w********m 发帖数: 1137 | 27 这种题你要不停的问问题。
你首先要问这些log是放在什么地方。hdfs,或者数据库,或者S3。第二你要问他这些
query要real-time, 还是batch操作。
要是hdfs,可能是how to design a key-value store, how to implement data
streaming
要是数据库,可能是how to design memcached
反正玩法很多。 |
|
b**********5 发帖数: 7881 | 28 找 Eddie Kuck 的linkedin。。。
======================
I found your resume online, I wanted to see if you might know someone you
could refer for a Software Engineer with strong Python knowledge for a role
with a company in downtown Seattle.
We offer a referral bonus of $400 for anyone you refer whom we place. It’s
more of a mid-level role, looking for someone with around 6 years of
experience. I’m including the job description below in case you might know
of anyone to refer.
And of course, should your... 阅读全帖 |
|
a*****u 发帖数: 1712 | 29 看点论文,fb的memcache,tao论文
稍微有点难,对new grad来说。简单的看看一篇blog,教你如果迅速秒杀掉99%海量数
据处理面试题
New grad, 对这方面不太懂, 有什么快速准备的方法吗(应该不用很深入)?谢谢了。 |
|
b**********5 发帖数: 7881 | 30 再看了看, 好像file是persistent storage, buffer就好像memcache一样。。。然后
就是用个bitset记住那个block被用。 然后onShudown的时候, dump every block 和
这个bitset到file里, 然后startup的时候, 去read 这个file和corresponding
bitset去建立这个buffer。。。 |
|
d********w 发帖数: 363 | 31 http://dongfei.baijia.baidu.com/article/54768
提到大数据分析平台,不得不说Hadoop系统,Hadoop到现在也超过10年的历史了,很多
东西发生了变化,版本也从0.x进化到目前的2.6版本。我把2012年后定义成后Hadoop平
台时代,这不是说不用Hadoop,而是像NoSQL (Not Only SQL)那样,有其他的选型补
充。我在知乎上也写过Hadoop的一些入门文章 如何学习Hadoop - 董飞的回答,为了给
大家有个铺垫,简单讲一些相关开源组件。
背景篇
Hadoop: 开源的数据分析平台,解决了大数据(大到一台计算机无法进行存储,一台计
算机无法在要求的时间内进行处理)的可靠存储和处理。适合处理非结构化数据,包括
HDFS,MapReduce基本组件。
HDFS:提供了一种跨服务器的弹性数据存储系统。
MapReduce:技术提供了感知数据位置的标准化处理流程:读取数据,对数据进行映射
(Map),使用某个键值对数据进行重排,然后对数据进行化简(Reduce)得到最终的
输出。
Amazon Elastic Map Red... 阅读全帖 |
|
d********w 发帖数: 363 | 32 http://dongfei.baijia.baidu.com/article/54768
提到大数据分析平台,不得不说Hadoop系统,Hadoop到现在也超过10年的历史了,很多
东西发生了变化,版本也从0.x进化到目前的2.6版本。我把2012年后定义成后Hadoop平
台时代,这不是说不用Hadoop,而是像NoSQL (Not Only SQL)那样,有其他的选型补
充。我在知乎上也写过Hadoop的一些入门文章 如何学习Hadoop - 董飞的回答,为了给
大家有个铺垫,简单讲一些相关开源组件。
背景篇
Hadoop: 开源的数据分析平台,解决了大数据(大到一台计算机无法进行存储,一台计
算机无法在要求的时间内进行处理)的可靠存储和处理。适合处理非结构化数据,包括
HDFS,MapReduce基本组件。
HDFS:提供了一种跨服务器的弹性数据存储系统。
MapReduce:技术提供了感知数据位置的标准化处理流程:读取数据,对数据进行映射
(Map),使用某个键值对数据进行重排,然后对数据进行化简(Reduce)得到最终的
输出。
Amazon Elastic Map Red... 阅读全帖 |
|
s******7 发帖数: 1758 | 33 现在的app server跑memcache 不就是用来干这个的,我现在join都用的少了,什么都
是一次性读出来cache, 再automation更新。敏感交易数据才会join来join去的,一堆
constraint. |
|
b******g 发帖数: 77 | 34 Offer:
=====
背景:非cs PhD+两年半经验
申请了Amazon,FB 和 G。
A家Rejected:1st 电面遇三哥,被黑
f家Offer: ~24w/year + 5w sign on
g家Offer: ~25w/year + 3.5w sign on
两个Offer都很好,很难选择,最后去了狗。
FB 是板上的大哥帮我内推的,人非常非常好,很热心,很可惜最后没去,特别特别的
感谢他。
G家是哥们内推的,帮忙收集了很多准备材料,有问必答。
最感谢的是,老婆,岳父,岳母,提供充足的后期保障,说实话,照顾宝宝比什么写码
刷题,累得多。
面经:
====
A家电面:
-----------
三哥,出了5道题,30分钟全部搞定,还是被黑了。当时没有经验,应该面试完后
立刻投诉。出结果后才向HR投诉,未果。
1 given 2 strings,can you construct str1 using chars in str2?
2 binary tree inorder traversal,both recursiv... 阅读全帖 |
|
b**********5 发帖数: 7881 | 35 我是正牌技校出来的。 HBase, memcached, storm, 都搞过, 都调过, 干活卖力
, 晚上周末都能帮你干。。。 结果呢, 一个工作都找不到。。。
印度大妈, 生物转学, 中国二奶, 都能干的活。。。 |
|
b******g 发帖数: 77 | 36 Offer:
=====
背景:非cs PhD+两年半经验
申请了Amazon,FB 和 G。
A家Rejected:1st 电面遇三哥,被黑
f家Offer: ~24w/year + 5w sign on
g家Offer: ~25w/year + 3.5w sign on
两个Offer都很好,很难选择,最后去了狗。
FB 是板上的大哥帮我内推的,人非常非常好,很热心,很可惜最后没去,特别特别的
感谢他。
G家是哥们内推的,帮忙收集了很多准备材料,有问必答。
最感谢的是,老婆,岳父,岳母,提供充足的后期保障,说实话,照顾宝宝比什么写码
刷题,累得多。
面经:
====
A家电面:
-----------
三哥,出了5道题,30分钟全部搞定,还是被黑了。当时没有经验,应该面试完后
立刻投诉。出结果后才向HR投诉,未果。
1 given 2 strings,can you construct str1 using chars in str2?
2 binary tree inorder traversal,both recursiv... 阅读全帖 |
|
b**********5 发帖数: 7881 | 37 我是正牌技校出来的。 HBase, memcached, storm, 都搞过, 都调过, 干活卖力
, 晚上周末都能帮你干。。。 结果呢, 一个工作都找不到。。。
印度大妈, 生物转学, 中国二奶, 都能干的活。。。 |
|
f*******r 发帖数: 976 | 38 恭喜!
Offer:
=====
背景:非cs PhD+两年半经验
申请了Amazon,FB 和 G。
A家Rejected:1st 电面遇三哥,被黑
f家Offer: ~24w/year + 5w sign on
g家Offer: ~25w/year + 3.5w sign on
两个Offer都很好,很难选择,最后去了狗。
FB 是板上的大哥帮我内推的,人非常非常好,很热心,很可惜最后没去,特别特别的
感谢他。
G家是哥们内推的,帮忙收集了很多准备材料,有问必答。
最感谢的是,老婆,岳父,岳母,提供充足的后期保障,说实话,照顾宝宝比什么写码
刷题,累得多。
面经:
====
A家电面:
-----------
三哥,出了5道题,30分钟全部搞定,还是被黑了。当时没有经验,应该面试完后
立刻投诉。出结果后才向HR投诉,未果。
1 given 2 strings,can you construct str1 using chars in str2?
2 binary tree inorder traversal,both rec... 阅读全帖 |
|
b**********5 发帖数: 7881 | 39 哎, 看了这答案, 觉得自己差距啊。。。 现在面试, 光刷题还不够。。还真要知道
这种memcache, hbase, cassandra的implementation, 我自己刷题, 还刷不好。。。 |
|
b*****n 发帖数: 618 | 40 个人意见。
芒果更像数据库,redis一般做cache不会直接当数据库用。
不过一般scale到一定程度芒果比较多用来做index。
芒果dynamic schema,可以支持更加灵活的query,用起来比较方便,这个是为什么用
的人多的原因。
如果只是kv store,redis速度更快,不过redis也可以选择persistent存数据到disk。
除非真的非常需要dynamic schema,否则芒果比较鸡肋,对于一般的use case sharded
mysql就够用了,如果需要cache就加一层redis或者memcache |
|
|
t********5 发帖数: 522 | 42 cache这个如果换做我的话我可能会先山寨一个memcached,然后高级点再山寨一个
redis,再高级点可能要山寨cassandra,不过最后这个只知道大概没有实际用过
真让我说到这一步我还真就只能胡扯了…… |
|
k******a 发帖数: 44 | 43 消息肯定要用一个队列管理,每一个消息有一个id,id按照时间排序。
各个设备维护一个本地当前消息id,每次从队列取比当前id更新的消息。
服务器端需要cluster,就是多台服务器共同处理。消息本身以id为key保存在
distribute key value map里,并利用memcached类的东西加速。如果一台服务器crash
,其他服务器继续工作。distributed key value map可以保证数据的availability。
当数据太大的时候,将一个消息分为多个部分,每个部分看做一个消息,只要消息的id
是顺序正确的就可以。
用cluster的horizontal scale解决消息数量巨大的问题,以及availability问题。具
体的技术,可以使用erlang, scala,nodejs这些支持高并发的技术。
感觉面试官可能关心的系统架构设计,而不是OO设计。 |
|
|
c******n 发帖数: 4965 | 45 mysql mysql 一直就试图在小马dorm 的时代的架构不断patch patch, mysql+memcache
+ php 到现在都没有变。
说实在的他们弄那个hiphop 看起来很fancy, 其实实在是在一个错误的大方向下面的
无奈选择。 现在web framework 那么多, natively 性能超过hiphop generated code
肯定有, 就不用麻烦过一遍hiphop 了 |
|
l******n 发帖数: 648 | 46 FB内部hackish成风
就这个风格
短期还凑合
长久恐怕有问题
memcache
code |
|
b**********5 发帖数: 7881 | 47 现在web framework 那么多, natively 性能超过hiphop generated code肯定有
那你举个例子呢。。。
memcache
code |
|
p*****2 发帖数: 21240 | 48 我以前听他们tech talk就这感觉
memcache
code |
|
l*****z 发帖数: 3022 | 49 技术控就是看不到实质,任何牛的公司都是business model牛,技术是次要的。
Bloomberg用的还是上世纪80年代的技术,并不妨碍钱滚滚来
memcache
code |
|
s*****m 发帖数: 8094 | 50 凑合吧,youtube也这个操行,不一样活的好好的?人还是用python在玩的。
startup比这个恐怖的不要太多啊。
memcache
code |
|