e***t 发帖数: 185 | 1 上周面的LinkedIn,今天HR 打电话过来说我面得还行,但是是border line, 他们
hiring committee讨论了很长时间最终决定把我拒了,心情很难受,听到”
unfortunately”的那一刻眼泪流出来。
把面试过程写出来,请过来人帮我看看。HR 说我主要是System Design 和coding 面的
不完美。其实题目都不难,面经和leetcode 上的题
System Design:LinkedIn有个share功能,在里面会出现一些URL,问题是找出在过去
一天,一小时,五分钟被share的top 5/10/...多的URL。
这个面的感觉有点窝囊,感觉再让我面一次一定说的更好,我是按照july那个帖子来说
的,先把这些url 的id hash一下 (总共1 million url 所以可以存到一张表里),然后
用kafka (Producer and Consumer),隔一段时间(这样可以减少IO)根据hash 结果
存到不同机器上做aggregation, 为了节省计算量,可以每一分钟一张表存frequency
,然后把这些表加起来用priori... 阅读全帖 |
|
发帖数: 1 | 2 你那个 system design,如果你回答的方式就像你描述的那样,换我也会挂了你。
Design 考察的不是你会不会做某些事情,而是看你怎么思考和解决问题的。 你直接跳
到一步一步流程化的步骤,会给人思维 depth 不够,沟通能力不好的感觉。 建议先重
复 design 问题,clarify design 的目标。 讲清楚这个事情的 challenge 在哪儿,
然后说个大概的思路,再然后再到具体的步骤。
你直接跳到 Kafka 这个层面的技术细节上,有经验的面试官直接会觉得你缺乏
structured thinking。 没经验的小孩儿会开始和你掰扯非常具体的回字四个写法级别
的无聊问题。 怎么样你都得不偿失。 |
|
发帖数: 1 | 3 设计题中, 为什么要用kafka?如果queue中的积攒了大量message怎么办? |
|
发帖数: 1 | 4 Title : Data Engineer
Location: San Francisco, CA
work type: full-time
salary: 150K
Our Approach
Leading with innovation and placing customers at the forefront are crucial
cornerstones that the company laid when it was first founded. And they
remain today. Indeed, PRO’s offerings have evolved over the years because
we have listened to our customers while keeping a close eye on the
marketplace.
In doing so, PRO can tout a proven track record of innovation (“industry
firsts”) that include:
᠒... 阅读全帖 |
|
m********u 发帖数: 3942 | 5 工作地点在Santa Clara, CA
有兴趣可以站内或者发邮件联系 [email protected]/* */
Requirements:
• BS or higher degree in Computer Science or related field.
• 5+ years of software development experience, including
performance analysis.
• Strong SQL knowledge in query processing, optimization and
execution, query performance, Explain, database tooling
• Metadata, data governance, and data security a strong plus
• Extensive experience in JDBC
• Spark is a big pl... 阅读全帖 |
|
l******n 发帖数: 9344 | 6 地点在LA, EL Segundo
最好是local或者可以relocate的,有兴趣的请把resume发到[email protected]/* */
现在希望能在明年一月份开始工作,所以有合适的人选可以很快又结果。
Major Responsibilities:
Design, code, and test enhancements for stream analytics software. Plan and
manage engineering tasks within projects,perform related requirements
analysis, performance analysis, and problem analysis. As needed, establish
technical direction for feature development, and with SMEs develop new
product functionalities.
The required skills for this position inclu... 阅读全帖 |
|
j********x 发帖数: 2330 | 7 10年了,不要学过时的技术。
学一下apache spark,kubernets,apache kafka |
|
w**********0 发帖数: 192 | 8 收购之后当然必须退市 股票变成微软股票
包裹短期不变 长期包裹乃至级别 和微软接轨 是非常顺理成章的事
因为LNKD的那些东西并没有很强的技术壁垒 搞了这么多年 原创型的技术作品勉勉
强强只能拿出一个kafka
这东西无论从原创性和难度上都和其他公司的作品比如mapreduce, cassandra,
spanner没法比
根本用不着花更多的钱来养这么多昂贵的写社交软件的员工。
购买LNKD 买的是这个生意。 至于它具体的技术实现,用微软的那一套技术栈一样可
以实现的很好,
那为什么不用微软现有的.net程序员们去做呢? 价格还更便宜。 |
|
发帖数: 1 | 9 Title : big data & infrastructure Engineer
Location: San Diego, CA
work type: full-time
salary: Open - 500K ( Total package)
Job Description
This position is responsible for Data Processing Infrastructure. You will
play an important role in designing storage and computing platforms that
enable researchers and engineers to implement their ideas in an efficient
and effective way. You are expected to have strong skills in technical
design, implementation and troubleshooting.
Responsibilities
Desig... 阅读全帖 |
|
m********u 发帖数: 3942 | 10 工作地点Santa Clara,CA
有兴趣的同学可以站内信或者发邮件:[email protected]/* */
Responsibilities:
• Design a comprehensive metadata support for the platform that
supports various data governance and security capabilities.
• Enhance the distributed query engine for various use cases,
especially in the area of heterogeneous data sources and cross-data-centers
query optimization.
• Develop algorithms that analyze query workload, derive common
workload characteristics, generate recommend... 阅读全帖 |
|
j***a 发帖数: 1100 | 11 有什么hardcore大牛你说说?kafka?吹了多少年了?
整个公司除了teammoney都清闲的要死。teammoney也没啥hardcore,就是把老中当奴隶
使唤,然后pip不听话和不愿意跪舔的。
赚钱还卖,是牛逼吹的太大保不住了。不卖给微软,股价贴到50然后破产也不是不可能
。还hardcore。
被收购后不能和GF并列一线,不能装逼了。现在阿三全面上位,有点本事的老中快跑吧
。跪舔阿三也不会有好结果的。 |
|
g*********e 发帖数: 14401 | 12 Kafka is nothing but a streaming system. Not worth mentioning. True
technology that gives an edge to linkedin won't be allowed to be open to
public.
The graph team does some unique work that no organization in Bay Area does. |
|
H**********5 发帖数: 2012 | 13 如题。以下这些东东,哪些目前在就业市场更受关注,面试时更可能的被问的详细?
Mongodb
Json
Restful API
Avro
Kafka
Oozie
Azure
Zookeeper
Protobuf
HDFS
Hadoop
Yarn
calsh
Cassandra
RabbitMq
ActiveMq
ZeroMq |
|
i*****j 发帖数: 41 | 14 地点在Mountain View, Samsung Research America目前招聘5+年经验的server side
engineer。请发简历到
[email protected]/* */
JD:
Server Software Engineer
Location: Mountain View, CA
General Description:
This is a great opportunity for a talented and hard-working Senior Engineer
or Technical Lead to step up to the next level, and build cloud services for
users of the world’s best-selling mobile devices. The Samsung Mobile Cloud
Services Team is focused on the rapid development of cloud based end-to-end
mobile ap... 阅读全帖 |
|
i*****j 发帖数: 41 | 15 地点在Mountain View, Samsung Research America目前招聘5+年经验的server side
engineer。请发简历到
[email protected]/* */
JD:
Server Software Engineer
Location: Mountain View, CA
General Description:
This is a great opportunity for a talented and hard-working Senior Engineer
or Technical Lead to step up to the next level, and build cloud services for
users of the world’s best-selling mobile devices. The Samsung Mobile Cloud
Services Team is focused on the rapid development of cloud based end-to-end
mobile ap... 阅读全帖 |
|
s******f 发帖数: 3984 | 16 一个岗位急需,
老司机、应届生都可以,
填的组内空缺
有意者请直接发email:[email protected]/* */
Software Engineer, Sr I - Synopsys
location: Boston MA
Responsibilities
Your work will include:
• Design, build and maintain our next generation of security and
eLearning products.
• Manage performance and flexibility in distributed architectures.
• Being a strong communicator with ability to coordinate and follow-up
aggressively.
• Conducting technical evaluations of new frameworks and plugins.
• ... 阅读全帖 |
|
x****y 发帖数: 252 | 17 请教一下关于kuberbetes。kubernetes docker在redhat Linux环境下high
traffic app运行如何?我们组在选择open source。其他组有用
kubernetes docker支持Kafka的应用,但是有很多问题。所以想听
听建议。多谢! |
|
|
|
|
j***a 发帖数: 1100 | 21 kafka可以有不同的topic,内部reqest一个topic 外部一个
完美解决 哈哈 |
|
|
d****n 发帖数: 12461 | 23 这块大的框架快做完了,细节有不少。框架无非是kappa架构,老马车storm, samza,
新马车apex, beam,flink,heron和kafka streams,其实大同小异已经开始争夺niche
市场了。单从Linkedin来说恐怕业务比较单一没太多新东西,单纯做流处理和etl已经
没啥好做了。但是微软和google这些带人工智能的我觉得这只是第一步,所以能做的还
不少。
当然学这些要比说自己做大数据的要好。 |
|
K*********8 发帖数: 62 | 24 Hi all,
Comcast has one team now is hiring SE, QA, DevOp.
If you are using the programming languages below:
C++ , Python , Scala, go, /golang, and C++
Spark, Kafka, Cassnadra
Java, IOS, Java Scripts et al
Please go ahead message me and send your resume ASAP, I will pass your
resumes to HM.
Thanks
J |
|
b**********h 发帖数: 419 | 25 朋友烙印组里让两个三姐QA做microservice攒开发经验,从零开始学习spring。还是个
挺复杂的产品
让不会Java的烙印做Kafka Spark,
然后让两个正经Java developer做前端。 |
|
c***w 发帖数: 134 | 26 我见过的工业届的做法是这样的
用redis cluster管理cluster,其中有hashslot 16384个,hashslot和shard一样,之
后用redis 中的排序集合存数据,存不同的纬度,比如一个区域,城市,州,国家的排
名(leaderboards),或者好友排名等。用redis有一个问题就是,容易丢数据,redis一
般用AOF (persist writes)或者 RDB (snapshot) ,问题是不容易存每一个write。因
为snapshot是没分钟级别的,AOF可以调整成记录所有的writes,但是performance会特
别的差,官方doc不建议用。这时候,需要有个write ahead log之类的东西去记录,所
以不管你自己实现,或者用一些别的工具都可以。比如可以在redis前面放一个kafka。
另一个方向是不用redis,而是用一个牛逼的VoltDB数据库。效果有待检验。
这是我查的资料:
https://stackoverflow.com/questions/27706573/huge-leaderboard-ranking-with-
f... 阅读全帖 |
|
c***w 发帖数: 134 | 27 可以参照redis加上kafka的实现。自己设计下就好了呀。 |
|
m********u 发帖数: 3942 | 28 最好有绿卡~ 有兴趣请站内或者邮件 [email protected]
Job Descriptions:
Our client is looking for a motivated and talented java developer to join
our engineering team to develop the next generation programmatic advertising
system. The candidate will play a key role in the design & development of
a product suite that contributes to the evolution of the programmatic
advertising industry and his/her work will help to differentiate company
from its competitors. Prior experience in programmatic advertising or re... 阅读全帖 |
|
m********u 发帖数: 3942 | 29 最好有绿卡~ 有兴趣请站内或者邮件 [email protected]
Job Descriptions:
Our client is looking for a motivated and talented java developer to join
our engineering team to develop the next generation programmatic advertising
system. The candidate will play a key role in the design & development of
a product suite that contributes to the evolution of the programmatic
advertising industry and his/her work will help to differentiate company
from its competitors. Prior experience in programmatic advertising or re... 阅读全帖 |
|
l******r 发帖数: 9 | 30 绿盟科技北美研发中心招人了 绿盟成立于2000年4月。绿盟科技被誉为安全界的黄埔军
校 为网络空间安全培养了大量的人才。绿盟积极开拓国际市场 在北美成立了研发中心
诚聘北美地区高端人才 Cloud architect at NSFOCUS, Santa Clara, CA
Please send your resume to [email protected]
NSFOCUS is an iconic Internet Security Company in China, a
trustworthy security company behind all the Fortune 100 company that rooted
in China. Founded in 2000, and with 17 years of history, it has set the
standard for corporate culture and unparalleled strength in the Internet
Security market.
We are lo... 阅读全帖 |
|
m********u 发帖数: 3942 | 31 【 以下文字转载自 Seattle 讨论区 】
发信人: missingyou (miss), 信区: Seattle
标 题: Senior Full Stack Engineer -- long term contractor职位
发信站: BBS 未名空间站 (Wed Jun 28 15:01:54 2017, 美东)
有兴趣请站内或者邮件 [email protected]
Our client is is looking for talented Senior Full Stack Software Development
Engineers for supporting product development and advanced R&D innovations
of services in the cloud.
The lab urgently needs senior full stack software development engineers who
are passionate about state-of-art big data platf... 阅读全帖 |
|
s*****r 发帖数: 43070 | 32 学校的问题不大,但工作项目一栏写的太少了,工作4年,项目可以单独写一页,现在
写得还没有在校学生多
建议不要提J2EE,显得很lowB。kafka,zookeeper,HBase,memcached比神马MVC要高
大上很多,应该放到前面
工作后,学校的项目就不要提了,都知道是个练习,没人会care的 |
|
|
r*****s 发帖数: 1815 | 34 这尼玛不就是design一个缩水版本的kafka吗
没有distributed systems的经验是很难的
consistency就够喝一壶的
得问问面试官自己会不会 |
|
x***4 发帖数: 1815 | 35 这是kafka吧。能做出来,应该可以自己开店了。
per
should
scale |
|
x**y 发帖数: 644 | 36 可以打中文了,
不知道可不可以,如果像Kafka 那样, 怎么保证FIFO? 有经验的朋友来谈谈该怎么
处理这种问题?
比如即使不能做到所有的要求, 那在回答的时候该怎么回答(比如先保重1 & 2 )? |
|
r*****s 发帖数: 1815 | 37 严格的"FIFO"在多client下是不存在的,因为不存在准确的全球时钟
spanner目前是个怪胎,它的全球时钟实现暂时不考虑。
这里的FIFO只能认为是最简单情况,每个client的消息FIFO。(要保证clients之间的
causal order又会变得很复杂。。一般来说也没有这个需求吧。。)
所以结论基本就是client消息加编号咯。当且仅当0...n-1消息都收到时,才将n消息再
发给接收端。
WAL尽量保证故障恢复(因为要high throughput所以quorum不一定可以用)
最后如果因为种种原因真的卡了,那就真的卡了,选择timeout舍弃100%的FIFO还是选
择卡住等人来修,就是看requirement了。。。
: 可以打中文了,
: 不知道可不可以,如果像Kafka 那样, 怎么保证FIFO? 有经验的朋友来谈谈
该怎么
: 处理这种问题?
: 比如即使不能做到所有的要求, 那在回答的时候该怎么回答(比如先保重1 |
|
m******e 发帖数: 82 | 38 还是认真回答一下吧:
1. 你可以设想每个银行开放自己的接口,可以操作credit/debit card,在你的系统中
可以抽象一层,对外暴露统一接口,对内处理各种银行。以后有了新的银行就可以在接
口不变的情况下扩展。这时你会发现其实外面有这样的服务了,比如stripe。
2. 直接返回错误用户体验太差,可以添加重试机制,异步扣款,扣款成功邮件提醒。
3. 这是一个compliance问题,涉及法律问题,应该由business的人决定,当然保存了
之后下次再捐款可以很便捷。
4. 不同数据存不同数据库,像个人信息,卡信息可以存rdbms。一些activity之类的可
以存nosql。
5. 要么同步,要么异步,自己分析
6. 用不用queue跟业务量和业务逻辑有关,如果要用就上kafka
7. 数据库变大影响是索引变大,查询更新速度变慢,所有你能想到的优化都说一遍,
比如sharding,read replica,caching |
|
l******r 发帖数: 9 | 39 Senior Software Engineer @ NSFOCUS, Santa Clara, CA
NSFOCUS is an iconic Internet Security Company in China, a trustworthy
security company behind all the Fortune 100 company that rooted in China.
Founded in 2000, and with 17 years of history, it has set the standard for
corporate culture and unparalleled strength in the Internet Security market.
It covers threat intelligence, Anti-DDoS, advanced threat protection, web
security, and provides global operations of network security products and
ser... 阅读全帖 |
|
发帖数: 1 | 40 我上个月中旬才开始找工作,到现在投了不到100个的样子吧。
QUALIFICATIONS
Hands-on experience in full-stack development
Strong knowledge of object-oriented programming and distributed system
Extensive development experience in Linux enviornment
Team player, self-motivated and excellent communication skills
Critical thinking, hardworking and a fast learner
SKILLS
Languages: Java, C, PHP, Shell Script, SQL, Scala, JavaScript, HTML, CSS
Tools: Eclipse, Maven, Subversion, Junit, Camel, TibcoEMS, Hadoop, HBase,
Spa... 阅读全帖 |
|
l*********r 发帖数: 122 | 41 1. system engineer
做一些系统或framework开发,如spark kafka之类的。
2. data engineer
基于各种framework整合搭建各种数据分析平台
3. data scientist
这个就应该是纯粹玩数据吧 |
|
n******g 发帖数: 2201 | 42 看你什么公司了
银行最高领导是power bi 专家
比你说的这些都简单
[在 lingertiger (lingertiger) 的大作中提到:]
:1. system engineer
:做一些系统或framework开发,如spark kafka之类的。
:基于各种framework整合搭建各种数据分析平台
:这个就应该是纯粹玩数据吧 |
|
s********s 发帖数: 77 | 43 其实无意介入这些争吵,今天我只是随便点进了这个帖子,但看到上面的一些讨论让我
觉得非常诧异。
1. 总体上这几个offer没有一个可以达到“无脑选XXX”的水平,不知道上面说无脑选
XXX的人是不是都是new grad,还是说你们都不关注业界的信息?除非这些offer中有一
个是FG级别的,否则不要张口就说无脑XXX来误导别人。
2. 可能老中还是带着国内那种名校情结来找工作,觉得只要公司名气大点,不管什么
职位和项目,无脑选一个老中认为很有名气的公司。这里暂且不谈论这个名校情结,仅
仅就amazon这个公司的名气问题,我觉得很多new grad就有一种错觉。无意冒犯,我认
识不少Amazon的朋友,从他们口中了解到一些amazon的信息。Amazon这个公司的产品,
技术确实很不错,大家用过都说好,毫无疑问的,但它的最大问题是待遇跟文化很差,
所以这个公司的整个package就大打折扣。我认识的不下10个amazon的朋友,他们大部
分都是1,2年就跳槽,然后还一直跟我说着amazon的各种抠门和文化如何差的事情,从
他们的语气中我甚至感受到了“恨意”,当时我听到这些吐槽,非常震惊,... 阅读全帖 |
|
w*****t 发帖数: 485 | 44 没那么夸张,至少search相关的组中国人占一半以上,其他Kafka samza估计印度人多
点,但也不是一边倒 |
|
b*******d 发帖数: 27 | 45 官方要求在这里
https://careers.walmart.com/us/jobs/931213BR-principal-software-engineer-big
-data-systems-sunnyvale-ca
虽然这是principal level的, 但是我们从new grad到principal职位都有
实际要求是能coding解决实际问题, 有CS基础常识; 如果理解/用过hadoop, hive最好,
不懂也没关系, 愿意学和能及时上手就行; 会spark, kafka, cassandra加分
我只提供一个信息在这里, 不能回答任何问题, 抱歉. 如果合适, recruiter自然会联
系你
感兴趣的可以发简历到referwmt艾特gmail, 邮件内容需要姓名, 电话, 邮件,
linkedin profile link. 不需要自我介绍, 评价, cover letter这些.
如果收到的简历太多, 我只能从里面选满足基本要求的内推. |
|
|
发帖数: 1 | 47 Company: Okta
Location: SF or San Jose
如果感兴趣,请发简历到 [email protected]
https://www.okta.com/company/careers/ga/senior-data-engineer--983309/
Senior Data Engineer
Position Description:
We are looking for an exceptional Senior Data Engineer who is responsible
for designing and developing robust, scalable solutions for large-scale data
infrastructure in a fast-paced agile environment. You will be encouraged to
initiate new projects to collect, store, and analyze data and to partner
with analysts... 阅读全帖 |
|
发帖数: 1 | 48 请问有没有人了解在 sunnyvale 的 search infra 和 samza 这两个组?求选择建议
Search Infra 主要基于 lucene,samza 组就用的是 kafka 和 samza。 |
|
n*******s 发帖数: 17267 | 49 花旗CATE CitiData要在达拉斯Irving找两人, VP level的,欢迎有5年经验以上的感
兴趣的同胞去申请。
不需要刷题,Java和SQL基本功扎实就可以, 用过Scala和python更好. 工作方向是
Data and stream processing, 说简单点,一个用Talend,另外一个用Kafka。
Exposure to big data, research experience和名校毕业有加分,一周可以有几天在
家工作。
就知道这么多, 希望可以帮到有缘人。
job posting去citi和indeed网站应该都可以找到。
对了,记得以前见过一个Dallas的哥们发过一个微信群,有人在群里的话,麻烦回个贴
,想申请加入。 |
|
发帖数: 1 | 50 oser我没别的offer,背景EE,35+,绿卡,这个ICC需要身分, 最近这一年自学coding,
Leetcode刷300-400题 ,有可能拿到ICC offer,有三个培训可以挑,培训时间5-6个星期
Data Engineer
• Distribute, store, and process data in a Hadoop cluster
• Write, configure, and deploy Apache Spark applications on a
Hadoop cluster
• Use the Spark shell for interactive data analysis
• Process and query structured data using Spark SQL
• Use Spark Streaming to process a live data stream
• Use Flume and Kafka to ingest dat... 阅读全帖 |
|