a*****8 发帖数: 26 | 1 Contact me at [email protected] if interested in.
This position is in the same group as me. 地址 Burlington, MA
The data engineer will work within the Data Management Platform (DMP) team
and is responsible for the development and maintenance of data from
Endurance, Constant Contact and third party sources in both batch and near
real time to analytic systems and customer touch point systems such as
Genesys and Salesforce. The DMP is built on the Hortonworks Data Platform
distribution of the h... 阅读全帖 |
|
r******l 发帖数: 10760 | 2 【 以下文字转载自 JobHunting 讨论区 】
发信人: redpearl (redpearl), 信区: JobHunting
标 题: LinkedIn的InDemand startup靠谱么?
发信站: BBS 未名空间站 (Fri Sep 26 12:10:56 2014, 美东)
2013:
1. cloudera
2. Dropbox
3. Violin memory
4. nimble storage
5. Hortonworks
6. GoPro
7. JAWBONE
8. big switch networks
9. Pinterest
10. NUTANIX
2012:
1. ARISTA
2. nicira
3. box
4. cloudera
5. Square
6. Pinterest
7. Violin memory
8. Palantir
9. Hortonworks
10. splunk
不知道今年的前十是哪些呢?还有往年的十名之后的名单能看到么? |
|
e****m 发帖数: 484 | 3 这个就不说了
不过yahoo 占 hortonworks 的40%。
还有,yahoo 是最大的hadoop 的用户,开发。
hortonworks,cloudera 做企业界的东西,一般不用 geo、world wide
yahoo 自己做global、world wide 的hadoop
不过其实这些都是小意思。真赚钱,也不靠这些。
FB ,gossip, 低级QQ 需要吗?
阿里巴巴,做淘宝,就拉了几个人闷一下的。(刚出来的时候,)
绝大部分公司,真需要做,也就是一些手脚麻利点,头脑清新点,任劳任怨点 50~100
人就够仂
其他,靠老友给你吹和关系就行了。 |
|
l******t 发帖数: 660 | 4 【 以下文字转载自 JobHunting 讨论区 】
发信人: dongfeiwww (人人都是艺术家), 信区: JobHunting
标 题: hadoop面试和学习总结
发信站: BBS 未名空间站 (Thu Mar 1 04:05:10 2012, 美东)
随着大数据的盛行,Hadoop也流行起来。我面过很多hadoop相关的公司,包括一线公司
(hadoop就是公司主要产品)如cloudera, hortonworks, mapr, teradata, greenplum,
二线的(使用hadoop):apple, expedia,comScore. 当然还有很多公司facebook,
twitter, baidu, 感觉这块还是机会挺多的,我就把我知道的一些给大家分享一下。
书籍和paper
: 里面内容非常好,既有高屋建瓴,又有微观把握,
比如mapreduce各个子阶段,经常问道join在里面也有代码实现,
google的三量马车,GFS, MapReduce, BigTable
入门:
知道MapRedu... 阅读全帖 |
|
S*******h 发帖数: 7021 | 5 之前有网友推荐这些. 我还没去仔细看过 你参考看看吧 有用的话上来吱一声
---------
发信人: dongfeiwww (人人都是艺术家), 信区: JobHunting
标 题: hadoop面试和学习总结
发信站: BBS 未名空间站 (Thu Mar 1 04:05:10 2012, 美东)
随著大数据的盛行,Hadoop也流行起来。我面过很多hadoop相关的公司,包括一线公司
(hadoop就是公司主要产品)如cloudera, hortonworks, mapr, teradata, greenplum,
二线的(使用hadoop):apple, expedia,comScore. 当然还有很多公司facebook,
twitter, baidu, 感觉这块还是机会挺多的,我就把我知道的一些给大家分享一下。
书籍和paper
: 里面内容非常好,既有高屋建瓴,又有微观把握,
比如mapreduce各个子阶段,经常问道join在里面也有代码实现,
google的三量马车,GFS, MapReduce, B... 阅读全帖 |
|
w**z 发帖数: 8232 | 6 http://www.infoworld.com/t/hadoop/cloudera-pitches-hadoop-every
When you have a big enough hammer, everything begins to look like the same
kind of nail.
That's one of the potential problems with Hadoop 2.0, the greatly reworked
big data processing framework that's been at the center of a whole storm of
developer and end user interest. Cloudera in particular has plans to make it
into a hammer for all kinds of nails.
There's no question that Hadoop 2.0 is a major leap over its predecessor.
Instead... 阅读全帖 |
|
|
z****e 发帖数: 54598 | 8 February 22, 2015 Nicole Hemsoth
art2
If you haven’t heard of Flink until now, get ready for the deluge. As one
of a stream of Apache incubator-to-top-level projects turned commercial
effort, the data processing engine’s promise is to deliver near-real time
handling of data analytics in a much faster, more condensed, and memory-
aware way than Hadoop or its in-memory predecessor, Spark, could do.
What really captured our attention, however, was the claim by Data Artisans,
the company behind Flin... 阅读全帖 |
|
l******t 发帖数: 660 | 9 hortonwork和claudia 都有training, 感觉claudia的好一些, hortonwork比较水 |
|
z****e 发帖数: 54598 | 10 【 以下文字转载自 JobHunting 讨论区 】
发信人: xmj http://www.zenofon.com/QHJRE, 信区: JobHunting
标 题: Re: MapR Technologies continue hiring a lot of positions
发信站: BBS 未名空间站 (Sat Jul 19 13:19:40 2014, 美东)
俺做bigdata5年多,这三家公司都研究过,简单说说供参考。
Cloudera成立早,有很多yahoo的老人在,骗了很多钱,目前以做service为主,比较领
先的是它的management tool,对hadoop的manage比其他的package要强。背后主要的支
持者是oracle和teradata,前段时间intel投资了。目前来看比较牛。他们自己搞了
impala,我的感觉有点不伦不类的。
Hortonworks是yahoo spinoff的,技术上来说,看看hadoop早年的code大概也知道是个
什么样水平。HDFS真心还不错,Mapreduce一般般了就。里面有很多以前做pig的人,目
前... 阅读全帖 |
|
o**********e 发帖数: 18403 | 11 【 以下文字转载自 JobHunting 讨论区 】
发信人: dongfeiwww (在路上), 信区: JobHunting
标 题: Hadoop Spark 学习小结[2014版]
关键字: Spark,Big Data,Hadoop
发信站: BBS 未名空间站 (Sun Aug 17 12:28:34 2014, 美东)
基于很多朋友希望更新这个学习资料,我就尽力按我的积累补充,are you ready, 享
受技术饕餮大餐
#Hadoop
Hadoop社区依然发展迅速,2014年推出了2.3,2.4, 2.5 的社区版本,比如增强
Resource Manager HA,
YARN Rest API, ACL on HDFS...
http://hadoop.apache.org/releases.html
根据我的观察,主要更新在Yarn,HDFS,而Mapreduce几乎停滞了,还有一些feature
属于安全,稳定可靠性一方面也是比较稳定了,但也可以说是瓶颈了。
http://hadoop.apache.org/who.html
这个是Hadoop projec... 阅读全帖 |
|
|
发帖数: 1 | 13 IBM is acquiring Red Hat, a major distributor of open-source software and
technology, in a deal valued around $34 billion, the companies announced on
Sunday.
According to a joint statement, IBM will pay cash to buy all shares in Red
Hat at $190 each. Shares in Red Hat closed at $116.68 on Friday before the
deal was announced.
The open source, enterprise software maker will become a unit of IBM’s
Hybrid Cloud division, with Red Hat CEO Jim Whitehurst joining IBM’s senior
management team and repor... 阅读全帖 |
|
d********w 发帖数: 363 | 14 你会hadoop,还是很多机会的, 也可以试试cloudera, hortonworks, greenplum, mapr
, teradata, 甚至oracle, amazon, facebook都有组在做这方面的 |
|
d********w 发帖数: 363 | 15 你会hadoop,还是很多机会的, 也可以试试cloudera, hortonworks, greenplum, mapr
, teradata, 甚至oracle, amazon, facebook都有组在做这方面的 |
|
l**d 发帖数: 746 | 16 m******[email protected]
Thank you!
顺便问一下,老大有cloudera, hortonworks的面经么? |
|
l**d 发帖数: 746 | 17 m******[email protected]
Thank you!
顺便问一下,老大有cloudera, hortonworks的面经么? |
|
P********e 发帖数: 387 | 18 mark
随着大数据的盛行,Hadoop也流行起来。我面过很多hadoop相关的公司,包括一线公司
(hadoop就是公司主要产品)如cloudera, hortonworks, mapr........
★ Sent from iPhone App: iReader Mitbbs 7.56 - iPad Lite |
|
r****s 发帖数: 1025 | 19 因为除了MapReduce没别的好用了,大家就忍了。
现在大家觉得MapReduce太慢了,所以Cloudera才开始全部上内存,Cloudera的意思是
,你如果要处理1T的数据,那就得要1T的内存,不够,就crash,问你怕未?
Doug Cutting就在Cloudera,MapReduce就是他最先做出来的。
那个啥HortonWorks的阿三就在瞎JB吹,有本事就去Apache Drill把东西做出来--对了
,Apache Drill是MapR。 |
|
d********w 发帖数: 363 | 20 我的帖子又顶上来了嘛,不知道hadoop的人也可以,hortonworks我还认识一个人之前
没做过任何hadoop的。这边it公司还是考一些算法基本coding,其他的都好办。 |
|
d********w 发帖数: 363 | 21 他家就基本上全是老印,但看他们做的还挺high的,blog更新的很频繁
0. hadoop大致问题
partition默认方式是什么,
1. HDFS 讨论,如何设置replica策略,默认是3,放置在local, local rack,
remote,但还是不够efficiently, 我看了mapr他们讲的策略,可以减少replica到1.5
,把数据切成一小块chunk,通过算法可以实现损失任意1/3的数据块,都可以恢复。还
有中想法是讲数据分成hot, cold,对hot数据尽量多写replica,cold就要achieve,定期
做merge
2. High Availability
提到0.23这个版本的改进,变化挺大的
3. next generation mapreduce framework. MR2
大致是把mesos, mapreduce,和其他并行计算的engine,通过配置嵌入到系统中,有
扩展性,方便支持其他的引擎,而不仅仅是以前的mapreduce一种了。
4. Pig组
特别是对join操作的优化,什么skew join, partition join,... 阅读全帖 |
|
|
|
z*********8 发帖数: 2070 | 24 传说中到处onsite攒mileage的大牛? |
|
|
d********w 发帖数: 363 | 26 他家就基本上全是老印,但看他们做的还挺high的,blog更新的很频繁
0. hadoop大致问题
partition默认方式是什么,
1. HDFS 讨论,如何设置replica策略,默认是3,放置在local, local rack,
remote,但还是不够efficiently, 我看了mapr他们讲的策略,可以减少replica到1.5
,把数据切成一小块chunk,通过算法可以实现损失任意1/3的数据块,都可以恢复。还
有中想法是讲数据分成hot, cold,对hot数据尽量多写replica,cold就要achieve,定期
做merge
2. High Availability
提到0.23这个版本的改进,变化挺大的
3. next generation mapreduce framework. MR2
大致是把mesos, mapreduce,和其他并行计算的engine,通过配置嵌入到系统中,有
扩展性,方便支持其他的引擎,而不仅仅是以前的mapreduce一种了。
4. Pig组
特别是对join操作的优化,什么skew join, partition join,... 阅读全帖 |
|
|
|
z*********8 发帖数: 2070 | 29 传说中到处onsite攒mileage的大牛? |
|
|
a*****s 发帖数: 1121 | 31 这个公司在linkedIn上的招聘广告号称,不需要懂Hadoop的人,只要懂java的。 |
|
a*****s 发帖数: 1121 | 32 这个公司在linkedIn上的招聘广告号称,不需要懂Hadoop的人,只要懂java的。 |
|
a*****s 发帖数: 1121 | 33 号称贡献最多的apache hadoop code,招hadoop developer要求不让有任何hadoop背景
,这个感觉很牛逼啊。雅虎控股的公司,名气上已经差cloudera一大截了。老兄你搞到
这家offer?
问的什么问题? |
|
j*****n 发帖数: 1545 | 34 我一直觉得 和 cloudera 不相上下吧, 差一大截吗 ? |
|
W******g 发帖数: 887 | 35 这家就是Yahoo!的Hadoop组分出来的阿,是Hadoop的鼻祖阿,怎么会名气上比CloudEra
差呢 |
|
a*****s 发帖数: 1121 | 36 号称贡献最多的apache hadoop code,招hadoop developer要求不让有任何hadoop背景
,这个感觉很牛逼啊。雅虎控股的公司,名气上已经差cloudera一大截了。老兄你搞到
这家offer?
问的什么问题? |
|
j*****n 发帖数: 1545 | 37 我一直觉得 和 cloudera 不相上下吧, 差一大截吗 ? |
|
W******g 发帖数: 887 | 38 这家就是Yahoo!的Hadoop组分出来的阿,是Hadoop的鼻祖阿,怎么会名气上比CloudEra
差呢 |
|
m******d 发帖数: 414 | 39 hadoop的creater Doug Cutting在cloudera。试过他家的东西,真不觉得怎样。
CloudEra |
|
|
j*******9 发帖数: 21 | 41 的确不需要有任何hadoop的经验。只要肯学就好了 |
|
j*******e 发帖数: 1058 | 42 马上要面了。他家是专门面hadoop的么??才第一轮电面,求各位支持。 |
|
k*********8 发帖数: 45 | 43 Oracle: private cloud platform
Hortonworks (startup): hadoop data platform
Walmartlabs: search
三个全去觉得太累, 哪个最值得去呢?求牛人指点~ |
|
D***n 发帖数: 149 | 44 A: Apple, Amazon
B: Broadcom, Bloomberg
C: Cisco, Cloudera
E: EBay
F: Facebook
G: Google,
H: Huawei, Hortonworks
I: Intel, IBM
L: Linkedin
M: Microsoft
N: Nvidia, Netflix
O: Oracle
P: Panasonic, Palantir
Q: Qualcomm, Quora
S: Salesforce, Samsung
T: Twitter, Two Sigma
Y: Yahoo, Yammer
Z: Zynger
楼下补充 :) |
|
|
j*******9 发帖数: 21 | 46 先读google发表的三篇paper,关于mapreduce, gfs, bigtable
然后apache hadoop上有些documentation.
读下这本书:Hadoop: The Definitive Guide。
然后在hortonworks, cloudera上有些video,blog可以看下,了解下。 |
|
d****n 发帖数: 56 | 47 这是我今年面试的时候收集的公司列表,大家可以用来参考着投简历~ 希望都能拿到
DREAM OFFER
Google, facebook, box, microsoft, hortonworks, amazon, yahoo, trip advisor,
groupon, salesforce,
zynga, pinterest, linkedin, twitter, apple, Nvidia, qualcomm, square, yelp,
netflix, skype, vmware,
paypal, evernote, quora, a9, 126 lab, yamer, jive, wikimedia, craigslist,
blizzard, mathworks, oracle,
emc, ebay, intuit, netapp, netsuite, adobe, autodesk, riverbed, concur,
aster data, EA, cisco, Ericsson
Hulu, IBM, Nokia, SAS, Intergraph, sybase, di... 阅读全帖 |
|
d******e 发帖数: 164 | 48 mark...
Google, facebook, box, microsoft, hortonworks, amazon, yahoo, trip advisor,
groupon, salesforce,
zynga, pinterest, linkedin, twitter, apple, Nvidia, qualcomm, square, yelp,
netflix, skype, vmware,
paypal, evernote, quora, a9, 126 lab, yamer, jive, wikimedia, craigslist,
blizzard, mathworks, oracle,
emc, ebay, intuit, netapp, netsuite, adobe, autodesk, riverbed, concur,
aster data, EA, cisco, Ericsson
Hulu, IBM, Nokia, SAS, Intergraph, sybase, directv, cloudera, nicira,
pocketgem, splunk,... 阅读全帖 |
|
w****x 发帖数: 2483 | 49 Google,
facebook,
box,
hortonworks
yahoo
trip advisor,
groupon
salesforce,
zynga
pinterest
linkedin
twitter
apple
Nvidia,
square,
yelp,
vmware,
paypal,
evernote,
quora,
yamer,
oracle,
emc,
ebay,
netapp,
adobe,
autodesk,
riverbed,
concur,
aster data,
EA,
cisco,
Ericsson
Hulu,
Nokia,
SAS,
sybase,
cloudera,
nicira,
pocketgem,
splunk,
2 sigma,
symentec,
morgan stanley,
dropbox
F5 networks
paypal
Bloomberg
Adobe
Auto desk
vmware
Groupon
AMD
Citadel
synopsys
Salesforce
HP
Intel
Nokia
juniper network
M... 阅读全帖 |
|
d******e 发帖数: 164 | 50 Mark:
Google,
facebook,
box,
hortonworks
yahoo
trip advisor,
groupon
salesforce,
zynga
pinterest
linkedin
twitter
apple
Nvidia,
square,
yelp,
vmware,
paypal,
evernote,
quora,
yamer,
oracle,
emc,
ebay,
netapp,
adobe,
autodesk,
riverbed,
concur,
aster data,
EA,
cisco,
Ericsson
Hulu,
Nokia,
SAS,
sybase,
cloudera,
nicira,
pocketgem,
splunk,
2 sigma,
symentec,
morgan stanley,
dropbox
F5 networks
paypal
Bloomberg
Adobe
Auto desk
vmware
Groupon
AMD
Citadel
synopsys
Salesforce
HP
Intel
Nokia
juniper net... 阅读全帖 |
|