由买买提看人间百态

topics

全部话题 - 话题: hortonwork
首页 上页 1 2 3 4 5 6 下页 末页 (共6页)
a*****8
发帖数: 26
1
Contact me at [email protected] if interested in.
This position is in the same group as me. 地址 Burlington, MA
The data engineer will work within the Data Management Platform (DMP) team
and is responsible for the development and maintenance of data from
Endurance, Constant Contact and third party sources in both batch and near
real time to analytic systems and customer touch point systems such as
Genesys and Salesforce. The DMP is built on the Hortonworks Data Platform
distribution of the h... 阅读全帖
r******l
发帖数: 10760
2
来自主题: SanFrancisco版 - LinkedIn的InDemand startup靠谱么? (转载)
【 以下文字转载自 JobHunting 讨论区 】
发信人: redpearl (redpearl), 信区: JobHunting
标 题: LinkedIn的InDemand startup靠谱么?
发信站: BBS 未名空间站 (Fri Sep 26 12:10:56 2014, 美东)
2013:
1. cloudera
2. Dropbox
3. Violin memory
4. nimble storage
5. Hortonworks
6. GoPro
7. JAWBONE
8. big switch networks
9. Pinterest
10. NUTANIX
2012:
1. ARISTA
2. nicira
3. box
4. cloudera
5. Square
6. Pinterest
7. Violin memory
8. Palantir
9. Hortonworks
10. splunk
不知道今年的前十是哪些呢?还有往年的十名之后的名单能看到么?
e****m
发帖数: 484
3
来自主题: Zhejiang版 - yahoo -- stock
这个就不说了
不过yahoo 占 hortonworks 的40%。
还有,yahoo 是最大的hadoop 的用户,开发。
hortonworks,cloudera 做企业界的东西,一般不用 geo、world wide
yahoo 自己做global、world wide 的hadoop
不过其实这些都是小意思。真赚钱,也不靠这些。
FB ,gossip, 低级QQ 需要吗?
阿里巴巴,做淘宝,就拉了几个人闷一下的。(刚出来的时候,)
绝大部分公司,真需要做,也就是一些手脚麻利点,头脑清新点,任劳任怨点 50~100
人就够仂
其他,靠老友给你吹和关系就行了。
l******t
发帖数: 660
4
来自主题: Database版 - hadoop面试和学习总结 (转载)
【 以下文字转载自 JobHunting 讨论区 】
发信人: dongfeiwww (人人都是艺术家), 信区: JobHunting
标 题: hadoop面试和学习总结
发信站: BBS 未名空间站 (Thu Mar 1 04:05:10 2012, 美东)
随着大数据的盛行,Hadoop也流行起来。我面过很多hadoop相关的公司,包括一线公司
(hadoop就是公司主要产品)如cloudera, hortonworks, mapr, teradata, greenplum,
二线的(使用hadoop):apple, expedia,comScore. 当然还有很多公司facebook,
twitter, baidu, 感觉这块还是机会挺多的,我就把我知道的一些给大家分享一下。
书籍和paper
: 里面内容非常好,既有高屋建瓴,又有微观把握,
比如mapreduce各个子阶段,经常问道join在里面也有代码实现,
google的三量马车,GFS, MapReduce, BigTable
入门:
知道MapRedu... 阅读全帖
S*******h
发帖数: 7021
5
来自主题: Java版 - 请问Hadoop要怎么学?
之前有网友推荐这些. 我还没去仔细看过 你参考看看吧 有用的话上来吱一声
---------
发信人: dongfeiwww (人人都是艺术家), 信区: JobHunting
标 题: hadoop面试和学习总结
发信站: BBS 未名空间站 (Thu Mar 1 04:05:10 2012, 美东)
随著大数据的盛行,Hadoop也流行起来。我面过很多hadoop相关的公司,包括一线公司
(hadoop就是公司主要产品)如cloudera, hortonworks, mapr, teradata, greenplum,
二线的(使用hadoop):apple, expedia,comScore. 当然还有很多公司facebook,
twitter, baidu, 感觉这块还是机会挺多的,我就把我知道的一些给大家分享一下。
书籍和paper
: 里面内容非常好,既有高屋建瓴,又有微观把握,
比如mapreduce各个子阶段,经常问道join在里面也有代码实现,
google的三量马车,GFS, MapReduce, B... 阅读全帖
w**z
发帖数: 8232
6
http://www.infoworld.com/t/hadoop/cloudera-pitches-hadoop-every
When you have a big enough hammer, everything begins to look like the same
kind of nail.
That's one of the potential problems with Hadoop 2.0, the greatly reworked
big data processing framework that's been at the center of a whole storm of
developer and end user interest. Cloudera in particular has plans to make it
into a hammer for all kinds of nails.
There's no question that Hadoop 2.0 is a major leap over its predecessor.
Instead... 阅读全帖
f********x
发帖数: 99
7
来自主题: Programming版 - 举几个java换成C++的例子
那为什么MapR还是做不过Hortonworks?
难道是C++的单机性能不如Java吗?
退一步讲,就算是但比性能,用Java也照样可以把Hive加速100x以上!
http://hortonworks.com/blog/update-stinger-view-microsoft-commi
z****e
发帖数: 54598
8
February 22, 2015 Nicole Hemsoth
art2
If you haven’t heard of Flink until now, get ready for the deluge. As one
of a stream of Apache incubator-to-top-level projects turned commercial
effort, the data processing engine’s promise is to deliver near-real time
handling of data analytics in a much faster, more condensed, and memory-
aware way than Hadoop or its in-memory predecessor, Spark, could do.
What really captured our attention, however, was the claim by Data Artisans,
the company behind Flin... 阅读全帖
l******t
发帖数: 660
9
来自主题: DataSciences版 - Haddop 有certification 吗
hortonwork和claudia 都有training, 感觉claudia的好一些, hortonwork比较水
z****e
发帖数: 54598
10
【 以下文字转载自 JobHunting 讨论区 】
发信人: xmj http://www.zenofon.com/QHJRE, 信区: JobHunting
标 题: Re: MapR Technologies continue hiring a lot of positions
发信站: BBS 未名空间站 (Sat Jul 19 13:19:40 2014, 美东)
俺做bigdata5年多,这三家公司都研究过,简单说说供参考。
Cloudera成立早,有很多yahoo的老人在,骗了很多钱,目前以做service为主,比较领
先的是它的management tool,对hadoop的manage比其他的package要强。背后主要的支
持者是oracle和teradata,前段时间intel投资了。目前来看比较牛。他们自己搞了
impala,我的感觉有点不伦不类的。
Hortonworks是yahoo spinoff的,技术上来说,看看hadoop早年的code大概也知道是个
什么样水平。HDFS真心还不错,Mapreduce一般般了就。里面有很多以前做pig的人,目
前... 阅读全帖
o**********e
发帖数: 18403
11
来自主题: DataSciences版 - Hadoop Spark 学习小结[2014版] (转载)
【 以下文字转载自 JobHunting 讨论区 】
发信人: dongfeiwww (在路上), 信区: JobHunting
标 题: Hadoop Spark 学习小结[2014版]
关键字: Spark,Big Data,Hadoop
发信站: BBS 未名空间站 (Sun Aug 17 12:28:34 2014, 美东)
基于很多朋友希望更新这个学习资料,我就尽力按我的积累补充,are you ready, 享
受技术饕餮大餐
#Hadoop
Hadoop社区依然发展迅速,2014年推出了2.3,2.4, 2.5 的社区版本,比如增强
Resource Manager HA,
YARN Rest API, ACL on HDFS...
http://hadoop.apache.org/releases.html
根据我的观察,主要更新在Yarn,HDFS,而Mapreduce几乎停滞了,还有一些feature
属于安全,稳定可靠性一方面也是比较稳定了,但也可以说是瓶颈了。
http://hadoop.apache.org/who.html
这个是Hadoop projec... 阅读全帖
m***r
发帖数: 359
12
来自主题: DataSciences版 - 大数据日报 2015年3月楼
大数据日报 2015-03-15
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-15/short.html
1) 【构建一个 ARM 集群,运行分布式 Docker 容器服务】 by @登州知府
关键词:数据库, 虚拟化, Docker, etcd, 容器
构建一个 ARM 集群,运行分布式 Docker 容器服务:第一部分,硬件 [1] 第二部分,
系统镜像 [2] 第三部分,分布式容器服务 [3]
[1] http://mkaczanowski.com/building-arm-cluster-part-1-collecting-wiring-and-powering-devices/
[2] http://mkaczanowski.com/building-arm-cluster-part-2-create-and-write-system-image-w... 阅读全帖

发帖数: 1
13
来自主题: Military版 - IBM要买小红帽
IBM is acquiring Red Hat, a major distributor of open-source software and
technology, in a deal valued around $34 billion, the companies announced on
Sunday.
According to a joint statement, IBM will pay cash to buy all shares in Red
Hat at $190 each. Shares in Red Hat closed at $116.68 on Friday before the
deal was announced.
The open source, enterprise software maker will become a unit of IBM’s
Hybrid Cloud division, with Red Hat CEO Jim Whitehurst joining IBM’s senior
management team and repor... 阅读全帖
d********w
发帖数: 363
14
来自主题: JobHunting版 - [apple面经] iOS software engineer
你会hadoop,还是很多机会的, 也可以试试cloudera, hortonworks, greenplum, mapr
, teradata, 甚至oracle, amazon, facebook都有组在做这方面的
d********w
发帖数: 363
15
来自主题: JobHunting版 - [apple面经] iOS software engineer
你会hadoop,还是很多机会的, 也可以试试cloudera, hortonworks, greenplum, mapr
, teradata, 甚至oracle, amazon, facebook都有组在做这方面的
l**d
发帖数: 746
16
来自主题: JobHunting版 - hadoop面试和学习总结
m******[email protected]
Thank you!
顺便问一下,老大有cloudera, hortonworks的面经么?
l**d
发帖数: 746
17
来自主题: JobHunting版 - hadoop面试和学习总结
m******[email protected]
Thank you!
顺便问一下,老大有cloudera, hortonworks的面经么?
P********e
发帖数: 387
18
来自主题: JobHunting版 - hadoop面试和学习总结
mark

随着大数据的盛行,Hadoop也流行起来。我面过很多hadoop相关的公司,包括一线公司
(hadoop就是公司主要产品)如cloudera, hortonworks, mapr........
★ Sent from iPhone App: iReader Mitbbs 7.56 - iPad Lite
r****s
发帖数: 1025
19
来自主题: JobHunting版 - hadoop面试和学习总结
因为除了MapReduce没别的好用了,大家就忍了。
现在大家觉得MapReduce太慢了,所以Cloudera才开始全部上内存,Cloudera的意思是
,你如果要处理1T的数据,那就得要1T的内存,不够,就crash,问你怕未?
Doug Cutting就在Cloudera,MapReduce就是他最先做出来的。
那个啥HortonWorks的阿三就在瞎JB吹,有本事就去Apache Drill把东西做出来--对了
,Apache Drill是MapR。
d********w
发帖数: 363
20
来自主题: JobHunting版 - [cloudera面试] senior engineer
我的帖子又顶上来了嘛,不知道hadoop的人也可以,hortonworks我还认识一个人之前
没做过任何hadoop的。这边it公司还是考一些算法基本coding,其他的都好办。
d********w
发帖数: 363
21
来自主题: JobHunting版 - [hortonworks面经] senior hadoop engineer
他家就基本上全是老印,但看他们做的还挺high的,blog更新的很频繁
0. hadoop大致问题
partition默认方式是什么,
1. HDFS 讨论,如何设置replica策略,默认是3,放置在local, local rack,
remote,但还是不够efficiently, 我看了mapr他们讲的策略,可以减少replica到1.5
,把数据切成一小块chunk,通过算法可以实现损失任意1/3的数据块,都可以恢复。还
有中想法是讲数据分成hot, cold,对hot数据尽量多写replica,cold就要achieve,定期
做merge
2. High Availability
提到0.23这个版本的改进,变化挺大的
3. next generation mapreduce framework. MR2
大致是把mesos, mapreduce,和其他并行计算的engine,通过配置嵌入到系统中,有
扩展性,方便支持其他的引擎,而不仅仅是以前的mapreduce一种了。
4. Pig组
特别是对join操作的优化,什么skew join, partition join,... 阅读全帖
g***y
发帖数: 764
22
来自主题: JobHunting版 - [hortonworks面经] senior hadoop engineer
大牛
j********x
发帖数: 2330
23
来自主题: JobHunting版 - [hortonworks面经] senior hadoop engineer
第一个就是erasure coding吧
z*********8
发帖数: 2070
24
来自主题: JobHunting版 - [hortonworks面经] senior hadoop engineer
传说中到处onsite攒mileage的大牛?
d********w
发帖数: 363
25
来自主题: JobHunting版 - [hortonworks面经] senior hadoop engineer
我哪有mileage,都是公司帮我定好的!
d********w
发帖数: 363
26
来自主题: JobHunting版 - [hortonworks面经] senior hadoop engineer
他家就基本上全是老印,但看他们做的还挺high的,blog更新的很频繁
0. hadoop大致问题
partition默认方式是什么,
1. HDFS 讨论,如何设置replica策略,默认是3,放置在local, local rack,
remote,但还是不够efficiently, 我看了mapr他们讲的策略,可以减少replica到1.5
,把数据切成一小块chunk,通过算法可以实现损失任意1/3的数据块,都可以恢复。还
有中想法是讲数据分成hot, cold,对hot数据尽量多写replica,cold就要achieve,定期
做merge
2. High Availability
提到0.23这个版本的改进,变化挺大的
3. next generation mapreduce framework. MR2
大致是把mesos, mapreduce,和其他并行计算的engine,通过配置嵌入到系统中,有
扩展性,方便支持其他的引擎,而不仅仅是以前的mapreduce一种了。
4. Pig组
特别是对join操作的优化,什么skew join, partition join,... 阅读全帖
g***y
发帖数: 764
27
来自主题: JobHunting版 - [hortonworks面经] senior hadoop engineer
大牛
j********x
发帖数: 2330
28
来自主题: JobHunting版 - [hortonworks面经] senior hadoop engineer
第一个就是erasure coding吧
z*********8
发帖数: 2070
29
来自主题: JobHunting版 - [hortonworks面经] senior hadoop engineer
传说中到处onsite攒mileage的大牛?
d********w
发帖数: 363
30
来自主题: JobHunting版 - [hortonworks面经] senior hadoop engineer
我哪有mileage,都是公司帮我定好的!
a*****s
发帖数: 1121
31
来自主题: JobHunting版 - [hortonworks面经] senior hadoop engineer
这个公司在linkedIn上的招聘广告号称,不需要懂Hadoop的人,只要懂java的。
a*****s
发帖数: 1121
32
来自主题: JobHunting版 - [hortonworks面经] senior hadoop engineer
这个公司在linkedIn上的招聘广告号称,不需要懂Hadoop的人,只要懂java的。
a*****s
发帖数: 1121
33
来自主题: JobHunting版 - hortonworks这个公司如何 (转载)
号称贡献最多的apache hadoop code,招hadoop developer要求不让有任何hadoop背景
,这个感觉很牛逼啊。雅虎控股的公司,名气上已经差cloudera一大截了。老兄你搞到
这家offer?
问的什么问题?
j*****n
发帖数: 1545
34
来自主题: JobHunting版 - hortonworks这个公司如何 (转载)
我一直觉得 和 cloudera 不相上下吧, 差一大截吗 ?
W******g
发帖数: 887
35
来自主题: JobHunting版 - hortonworks这个公司如何 (转载)
这家就是Yahoo!的Hadoop组分出来的阿,是Hadoop的鼻祖阿,怎么会名气上比CloudEra
差呢
a*****s
发帖数: 1121
36
来自主题: JobHunting版 - hortonworks这个公司如何 (转载)
号称贡献最多的apache hadoop code,招hadoop developer要求不让有任何hadoop背景
,这个感觉很牛逼啊。雅虎控股的公司,名气上已经差cloudera一大截了。老兄你搞到
这家offer?
问的什么问题?
j*****n
发帖数: 1545
37
来自主题: JobHunting版 - hortonworks这个公司如何 (转载)
我一直觉得 和 cloudera 不相上下吧, 差一大截吗 ?
W******g
发帖数: 887
38
来自主题: JobHunting版 - hortonworks这个公司如何 (转载)
这家就是Yahoo!的Hadoop组分出来的阿,是Hadoop的鼻祖阿,怎么会名气上比CloudEra
差呢
m******d
发帖数: 414
39
来自主题: JobHunting版 - hortonworks这个公司如何 (转载)
hadoop的creater Doug Cutting在cloudera。试过他家的东西,真不觉得怎样。

CloudEra
k***x
发帖数: 6799
40
来自主题: JobHunting版 - hortonworks这个公司如何 (转载)
这个感觉有点装逼啊。。。
j*******9
发帖数: 21
41
来自主题: JobHunting版 - hortonworks这个公司如何 (转载)
的确不需要有任何hadoop的经验。只要肯学就好了
j*******e
发帖数: 1058
42
来自主题: JobHunting版 - hortonworks算tier几的公司?求面筋
马上要面了。他家是专门面hadoop的么??才第一轮电面,求各位支持。
k*********8
发帖数: 45
43
Oracle: private cloud platform
Hortonworks (startup): hadoop data platform
Walmartlabs: search
三个全去觉得太累, 哪个最值得去呢?求牛人指点~
D***n
发帖数: 149
44
A: Apple, Amazon
B: Broadcom, Bloomberg
C: Cisco, Cloudera
E: EBay
F: Facebook
G: Google,
H: Huawei, Hortonworks
I: Intel, IBM
L: Linkedin
M: Microsoft
N: Nvidia, Netflix
O: Oracle
P: Panasonic, Palantir
Q: Qualcomm, Quora
S: Salesforce, Samsung
T: Twitter, Two Sigma
Y: Yahoo, Yammer
Z: Zynger
楼下补充 :)
d*******i
发帖数: 77
45
来自主题: JobHunting版 - 讨论一下还没上市的创业公司
typesafe
hortonworks
j*******9
发帖数: 21
46
来自主题: JobHunting版 - 求问hadoop学习资料
先读google发表的三篇paper,关于mapreduce, gfs, bigtable
然后apache hadoop上有些documentation.
读下这本书:Hadoop: The Definitive Guide。
然后在hortonworks, cloudera上有些video,blog可以看下,了解下。
d****n
发帖数: 56
47
来自主题: JobHunting版 - Company list
这是我今年面试的时候收集的公司列表,大家可以用来参考着投简历~ 希望都能拿到
DREAM OFFER
Google, facebook, box, microsoft, hortonworks, amazon, yahoo, trip advisor,
groupon, salesforce,
zynga, pinterest, linkedin, twitter, apple, Nvidia, qualcomm, square, yelp,
netflix, skype, vmware,
paypal, evernote, quora, a9, 126 lab, yamer, jive, wikimedia, craigslist,
blizzard, mathworks, oracle,
emc, ebay, intuit, netapp, netsuite, adobe, autodesk, riverbed, concur,
aster data, EA, cisco, Ericsson
Hulu, IBM, Nokia, SAS, Intergraph, sybase, di... 阅读全帖
d******e
发帖数: 164
48
来自主题: JobHunting版 - Company list
mark...
Google, facebook, box, microsoft, hortonworks, amazon, yahoo, trip advisor,
groupon, salesforce,
zynga, pinterest, linkedin, twitter, apple, Nvidia, qualcomm, square, yelp,
netflix, skype, vmware,
paypal, evernote, quora, a9, 126 lab, yamer, jive, wikimedia, craigslist,
blizzard, mathworks, oracle,
emc, ebay, intuit, netapp, netsuite, adobe, autodesk, riverbed, concur,
aster data, EA, cisco, Ericsson
Hulu, IBM, Nokia, SAS, Intergraph, sybase, directv, cloudera, nicira,
pocketgem, splunk,... 阅读全帖
w****x
发帖数: 2483
49
Google,
facebook,
box,
hortonworks
yahoo
trip advisor,
groupon
salesforce,
zynga
pinterest
linkedin
twitter
apple
Nvidia,
square,
yelp,
vmware,
paypal,
evernote,
quora,
yamer,
oracle,
emc,
ebay,
netapp,
adobe,
autodesk,
riverbed,
concur,
aster data,
EA,
cisco,
Ericsson
Hulu,
Nokia,
SAS,
sybase,
cloudera,
nicira,
pocketgem,
splunk,
2 sigma,
symentec,
morgan stanley,
dropbox
F5 networks
paypal
Bloomberg
Adobe
Auto desk
vmware
Groupon
AMD
Citadel
synopsys
Salesforce
HP
Intel
Nokia
juniper network
M... 阅读全帖
d******e
发帖数: 164
50
Mark:
Google,
facebook,
box,
hortonworks
yahoo
trip advisor,
groupon
salesforce,
zynga
pinterest
linkedin
twitter
apple
Nvidia,
square,
yelp,
vmware,
paypal,
evernote,
quora,
yamer,
oracle,
emc,
ebay,
netapp,
adobe,
autodesk,
riverbed,
concur,
aster data,
EA,
cisco,
Ericsson
Hulu,
Nokia,
SAS,
sybase,
cloudera,
nicira,
pocketgem,
splunk,
2 sigma,
symentec,
morgan stanley,
dropbox
F5 networks
paypal
Bloomberg
Adobe
Auto desk
vmware
Groupon
AMD
Citadel
synopsys
Salesforce
HP
Intel
Nokia
juniper net... 阅读全帖
首页 上页 1 2 3 4 5 6 下页 末页 (共6页)