由买买提看人间百态

topics

全部话题 - 话题: hadoop2
首页 上页 1 2 (共2页)
D********2
发帖数: 27
1
来自主题: Database版 - 如果你不喜欢老土, 看看这个
那是传销的手法。所有交钱注册的都使用假名。美国老土的真实姓名我们都不知道?!
1800多学生每人交至少5-6千美元,然后不断地在那里传销一些入门技术。
hadoop2 (千古) 的大作中提到: 】
姐 有区别吗?
D********2
发帖数: 27
2
来自主题: Database版 - 如果你不喜欢老土, 看看这个
那是传销的手法。所有交钱注册的都使用假名。美国老土的真实姓名我们都不知道?!
1800多学生每人交至少5-6千美元,然后不断地在那里传销一些入门技术。
hadoop2 (千古) 的大作中提到: 】
姐 有区别吗?
z*******3
发帖数: 13709
3
我们一般认为,1.X全部不可靠,2.0以后的版本基本稳定
可以上
k********e
发帖数: 368
4
额开始用cassandra了。
a**e
发帖数: 5794
5
所以Oracle出来时就是2.0,根本就没有1.0版。
z*******3
发帖数: 13709
6
ellison is smart
he dose know how to cheat
S****h
发帖数: 558
7
The most widely used and supported version is still 0.20 I think (including
CDH 3/4). They probably are going to carry the old mapred.* API for a long
long time.
w**z
发帖数: 8232
8
好东西。搞了1.1.x, 现在准备上1.2
p*****2
发帖数: 21240
9
来自主题: Java版 - 有人再用hadoop2.0吗?
准备学学。跟1.0区别很大吗?
x****d
发帖数: 1766
10
来自主题: Java版 - 有人再用hadoop2.0吗?
use for what? I know some kids use it to count tianlong babu. I am too lazy
to play with it. What about aws's mapreduce, easier than doing hadoop
yourself?
p*****2
发帖数: 21240
11
来自主题: Java版 - 有人再用hadoop2.0吗?

lazy
工作
z****e
发帖数: 54598
12
来自主题: Java版 - 有人再用hadoop2.0吗?
还在alpha版
beta都没上呢
我反正先不用
p*****2
发帖数: 21240
13
来自主题: Java版 - 有人再用hadoop2.0吗?

搞错了。装的是2.0,用的还是1.0。那就先学1.0了。
z*******3
发帖数: 13709
14
来自主题: Programming版 - Python就是爽
发信人: zhaoce073 (迟到早退不思上进的蜥蜴), 信区: Java
标 题: 等HADOOP2.0的稳定版本出来之后就上马
发信站: BBS 未名空间站 (Tue Apr 16 21:25:24 2013, 美东)
我们一般认为,1.X全部不可靠,2.0以后的版本基本稳定
可以上
z*******3
发帖数: 13709
15
来自主题: Programming版 - Python就是爽
发信人: zhaoce073 (迟到早退不思上进的蜥蜴), 信区: Java
标 题: 等HADOOP2.0的稳定版本出来之后就上马
发信站: BBS 未名空间站 (Tue Apr 16 21:25:24 2013, 美东)
我们一般认为,1.X全部不可靠,2.0以后的版本基本稳定
可以上
D**u
发帖数: 288
16
感觉scala+scalding要一统map-reduce的江湖了,要不是因为hadoop eco-system是
based on java,本身优势那么明显的python也不会就这么输了。
看看hadoop2.0出来后会不会有所改观吧。唉,本来以为python就行了,现在看起来必
须得学scala了,不过还好听说上手不是很难
d*******r
发帖数: 3299
17
来自主题: Programming版 - Clojure Storm 用在生产环境中如何?
Clojure Storm 用在生产环境中到底如何,简单可靠吗,坑多不多...?
我们组里讨论完,老板同意试用 Clojure Storm 来做做数据分析。
我呆在中部地区一个做Sports视频直播的小公司(农村人民特喜欢Sports, 我们还有不
少用户),公司从视频录制, 到上传到我们AWS的servers 上,再到最后分发 streaming
到 终端player,都是我们自己在写。
现在需要较快地分析大量从 终端player 软件上返回的各种信息, 比如直播效果和广告
的信息。
大家讨论说 hadoop2.0 是不是太慢太复杂,干脆去看看能用 Clojure Storm 不 --
其实我们组在这方面都是些菜菜,大家瞎折腾... :D
大牛们有在实际生产中用 Storm 相关的经验吗? 用这东西主要要注意哪些坑?还有,
我们都是些主用 Python 的菜菜,如果组里先不用 Clojure,只用 Python 能玩得动
Storm 不?
我们现在需求还有点模糊,等回头做了一阵可能再来请教大家。
p*****2
发帖数: 21240
18
来自主题: Programming版 - Clojure Storm 用在生产环境中如何?

streaming

很适合用Storm,Python写起来应该没有压力。hadoop2.0可以和storm结合来用。
d*******r
发帖数: 3299
19
来自主题: Programming版 - 坛子里有人搞HBase的吗?
每次看到hadoop2.0那个构架图,我就觉得它想做的事情太多了...
http://hortonworks.com/hadoop/yarn/
d*******r
发帖数: 3299
20
来自主题: Programming版 - 坛子里有人搞HBase的吗?
看完后更坚定了不花时间学习hadoop2.0的决定...
我等屌丝projects肯定用不上了,自己也不喜欢这么复杂的东西
s****y
发帖数: 503
21
我这两天装了一下Hadoop2.2的集群,用了Yarn和Zookeeper,执行Mapreduce的时候都
是用命令行,比如hadoop jar mapreduceExample.jar /user/root/data/source.txt /
user/root/output/result
当然我估计实际使用的时候还会用到Flume、HBase等技术,但是实际的Hadoop系统是什
么样的?都是用命令行人工执行的?
还有Hadoop和Java的关系是不是就是用Java写Mapreduce的程序,然后把jar部署到
Hadoop中运行,Hadoop和Java的联系是不是就这些?
D********2
发帖数: 27
22
来自主题: Biology版 - 美国老土值得去上吗
不值得。那是骗人的,俨然一个传销窝。地球人都知道。
http://bbs.wenxuecity.com/career/504365.html

发信人: DownLaoTu2 (DownLaotu), 信区: Database
标 题: Re: SSRS培训
发信站: BBS 未名空间站 (Sun Jan 4 20:42:42 2015, 美东)
那是传销的手法。所有交钱注册的都使用假名。美国老土的真实姓名我们都不知道?!
1800多学生每人交至少5-6千美元,然后不断地在那里传销一些入门技术。
hadoop2 (千古) 的大作中提到: 】
姐 有区别吗?
p*******i
发帖数: 1181
23
来自主题: Statistics版 - SAS的前景可怕吗?
这位仁兄第一段说的很对,硬盘和内存哪个可扩展空间大是毋庸置疑的。正巧我也在某
IT公司工作,clickstream data我们组也在处理,上T规模的data R是连参与讨论的资
格都没有的,所以我才列举的几十G的data给R一点机会。我们组还有Hive2+hadoop2+
SAS9.4的cluster+data处理的pipeline,似乎这里面也没有R什么事情了。当然从我们
公司来说,Python和Java显然是SDE的主流,作为Data Scientist学点Python和Java也
是必须的,我只是强调SAS比R在这方面强了不是一点半点。话说我们Director还刚给我
们全组安排了全天offsite的SAS training呢……
f*******3
发帖数: 206
24
来自主题: Statistics版 - SAS的前景可怕吗?
流口水,这位仁兄方便展开讲讲你提到的Hive2+hadoop2+SAS9.4是怎么架构的,是统计
师做的还是engineer做的,处理什么问题,这种处理方式效率如何,是production
level的code还是只为分析用的?
p*******i
发帖数: 1181
25
来自主题: Statistics版 - SAS的前景可怕吗?
这个是Engineer组做的,主要目的是real time data analytic platform, 对server端
的大量raw data(跟我们组相关的大概是100多个T,其他组还有不少data在上面),用
Hive2调用hadoop2来访问,然后输出的data通过SAS提供的Hive接口直接导入SAS,基本
上就是说从百来个T里面筛选出几十个G的数据做summary可以全程在SAS里完成,速度基
本上能控制在一小时之内。当然这个速度完全是通过Hive的分块和hadoop的map reduce
实现的,SAS只是提供了调用接口。具体coding显然不是一两个data scientist能完成
的了,所以要是没有足够的support engineer team,统计师在IT公司还是相当尴尬的
……
s*****h
发帖数: 44903
26
注:1)版面活动:手续费无;个人申请:手续费10%;:
1)
代发版面/ID::
Soccer版
代发事由(主题标题及链接,如有链接必须附上链接)::
2016年5月水枪奖励
http://www.mitbbs.com/article_t/Soccer/34113383.html
赞助(有:附链接。没有:无)::

楼主是否计入统计(如不填写,默认否)::

奖励金额(需注明扣除伪币来源)::
(请从版库扣除)
备注::
以下ID每人奖励100伪币
1 ironcat 94 77.7% (10) 49 (1) 0.52 (20)
2 zhangjianshi 89 9.0% (41) 22 (8) 0.25 (40)
3 Marzman 78 42.4% (20) 46 (2) 0.59 (10)
4 xmseraph 66 34.7% (23) 24 (7) 0.36 (30)
5 Szymczak 64 65.3% (14) 20 (1... 阅读全帖
m*********k
发帖数: 10521
27
"[Soccer]sunfish Jun 1 ● Soccer版5月水枪包"
成功奖励 100 伪币的用户: ironcat, zhangjianshi, Marzman, xmseraph, Szymczak,
Bernanke, jazztech, iamright, usaut, wewill2009, ridgway
成功奖励 50 伪币的用户: Urus, lookacar, moliniao, jzlian, pee, OneFlyingPig,
imcowbee, lizzyreal, zaa, bbdou, vandieman, eightmile, desertking,
holydistance, metalchurch, xzilch, HOTDELL, sunfish, withoutacar
成功奖励 20 伪币的用户: hadoop2, PNH689, wwj, ricst1985, franey, HQ, evga,
Simeone, philchenko, awaydream, withoutcar, swanswan, kreisler,... 阅读全帖
B*****g
发帖数: 34098
28
来自主题: DataSciences版 - hadoop生产环境
用一个node的都是hadoop1,建议搞hadoop2
首页 上页 1 2 (共2页)