第2页 - 关于hadoop2的讨论汇总 - 话题女王

全部话题 - 话题: hadoop2

D********2
发帖数: 27

来自主题: Database版 - 如果你不喜欢老土，看看这个

那是传销的手法。所有交钱注册的都使用假名。美国老土的真实姓名我们都不知道？！
1800多学生每人交至少5-6千美元，然后不断地在那里传销一些入门技术。
hadoop2 (千古) 的大作中提到: 】
姐有区别吗？

D********2
发帖数: 27

来自主题: Database版 - 如果你不喜欢老土，看看这个

z*******3
发帖数: 13709

来自主题: Java版 - 等HADOOP2.0的稳定版本出来之后就上马

我们一般认为，1.X全部不可靠，2.0以后的版本基本稳定
可以上

k********e
发帖数: 368

来自主题: Java版 - 等HADOOP2.0的稳定版本出来之后就上马

额开始用cassandra了。

a**e
发帖数: 5794

来自主题: Java版 - 等HADOOP2.0的稳定版本出来之后就上马

所以Oracle出来时就是2.0，根本就没有1.0版。

z*******3
发帖数: 13709

来自主题: Java版 - 等HADOOP2.0的稳定版本出来之后就上马

ellison is smart
he dose know how to cheat

S****h
发帖数: 558

来自主题: Java版 - 等HADOOP2.0的稳定版本出来之后就上马

The most widely used and supported version is still 0.20 I think (including
CDH 3/4). They probably are going to carry the old mapred.* API for a long
long time.

w**z
发帖数: 8232

来自主题: Java版 - 等HADOOP2.0的稳定版本出来之后就上马

好东西。搞了1.1.x, 现在准备上1.2

p*****2
发帖数: 21240

来自主题: Java版 - 有人再用hadoop2.0吗？

准备学学。跟1.0区别很大吗？

x****d
发帖数: 1766

来自主题: Java版 - 有人再用hadoop2.0吗？

use for what? I know some kids use it to count tianlong babu. I am too lazy
to play with it. What about aws's mapreduce, easier than doing hadoop
yourself?

p*****2
发帖数: 21240

来自主题: Java版 - 有人再用hadoop2.0吗？

lazy
工作

z****e
发帖数: 54598

来自主题: Java版 - 有人再用hadoop2.0吗？

还在alpha版
beta都没上呢
我反正先不用

p*****2
发帖数: 21240

来自主题: Java版 - 有人再用hadoop2.0吗？

搞错了。装的是2.0，用的还是1.0。那就先学1.0了。

z*******3
发帖数: 13709

来自主题: Programming版 - Python就是爽

发信人: zhaoce073 (迟到早退不思上进的蜥蜴), 信区: Java
标题: 等HADOOP2.0的稳定版本出来之后就上马
发信站: BBS 未名空间站 (Tue Apr 16 21:25:24 2013, 美东)
我们一般认为，1.X全部不可靠，2.0以后的版本基本稳定
可以上

z*******3
发帖数: 13709

来自主题: Programming版 - Python就是爽

D**u
发帖数: 288

来自主题: Programming版 - 不管你愿意不愿意，java正在prevailing

感觉scala+scalding要一统map-reduce的江湖了，要不是因为hadoop eco-system是
based on java，本身优势那么明显的python也不会就这么输了。
看看hadoop2.0出来后会不会有所改观吧。唉，本来以为python就行了，现在看起来必
须得学scala了，不过还好听说上手不是很难

d*******r
发帖数: 3299

来自主题: Programming版 - Clojure Storm 用在生产环境中如何?

Clojure Storm 用在生产环境中到底如何，简单可靠吗，坑多不多...?
我们组里讨论完，老板同意试用 Clojure Storm 来做做数据分析。
我呆在中部地区一个做Sports视频直播的小公司(农村人民特喜欢Sports, 我们还有不
少用户)，公司从视频录制, 到上传到我们AWS的servers 上，再到最后分发 streaming
到终端player，都是我们自己在写。
现在需要较快地分析大量从终端player 软件上返回的各种信息, 比如直播效果和广告
的信息。
大家讨论说 hadoop2.0 是不是太慢太复杂，干脆去看看能用 Clojure Storm 不－－
其实我们组在这方面都是些菜菜，大家瞎折腾... :D
大牛们有在实际生产中用 Storm 相关的经验吗? 用这东西主要要注意哪些坑？还有，
我们都是些主用 Python 的菜菜，如果组里先不用 Clojure，只用 Python 能玩得动
Storm 不?
我们现在需求还有点模糊，等回头做了一阵可能再来请教大家。

p*****2
发帖数: 21240

来自主题: Programming版 - Clojure Storm 用在生产环境中如何?

streaming
－
很适合用Storm，Python写起来应该没有压力。hadoop2.0可以和storm结合来用。

d*******r
发帖数: 3299

来自主题: Programming版 - 坛子里有人搞HBase的吗？

每次看到hadoop2.0那个构架图，我就觉得它想做的事情太多了...
http://hortonworks.com/hadoop/yarn/

d*******r
发帖数: 3299

来自主题: Programming版 - 坛子里有人搞HBase的吗？

看完后更坚定了不花时间学习hadoop2.0的决定...
我等屌丝projects肯定用不上了，自己也不喜欢这么复杂的东西

s****y
发帖数: 503

来自主题: Programming版 - Hadoop运行时是不是用命令行执行的？Hadoop和Java有什么联系？

我这两天装了一下Hadoop2.2的集群，用了Yarn和Zookeeper，执行Mapreduce的时候都
是用命令行，比如hadoop jar mapreduceExample.jar /user/root/data/source.txt /
user/root/output/result
当然我估计实际使用的时候还会用到Flume、HBase等技术，但是实际的Hadoop系统是什
么样的？都是用命令行人工执行的？
还有Hadoop和Java的关系是不是就是用Java写Mapreduce的程序，然后把jar部署到
Hadoop中运行，Hadoop和Java的联系是不是就这些？

D********2
发帖数: 27

来自主题: Biology版 - 美国老土值得去上吗

不值得。那是骗人的,俨然一个传销窝。地球人都知道。
http://bbs.wenxuecity.com/career/504365.html

发信人: DownLaoTu2 (DownLaotu), 信区: Database
标题: Re: SSRS培训
发信站: BBS 未名空间站 (Sun Jan 4 20:42:42 2015, 美东)
那是传销的手法。所有交钱注册的都使用假名。美国老土的真实姓名我们都不知道？！
1800多学生每人交至少5-6千美元，然后不断地在那里传销一些入门技术。
hadoop2 (千古) 的大作中提到: 】
姐有区别吗？

p*******i
发帖数: 1181

来自主题: Statistics版 - SAS的前景可怕吗？

这位仁兄第一段说的很对，硬盘和内存哪个可扩展空间大是毋庸置疑的。正巧我也在某
IT公司工作，clickstream data我们组也在处理，上T规模的data R是连参与讨论的资
格都没有的，所以我才列举的几十G的data给R一点机会。我们组还有Hive2+hadoop2+
SAS9.4的cluster＋data处理的pipeline，似乎这里面也没有R什么事情了。当然从我们
公司来说，Python和Java显然是SDE的主流，作为Data Scientist学点Python和Java也
是必须的，我只是强调SAS比R在这方面强了不是一点半点。话说我们Director还刚给我
们全组安排了全天offsite的SAS training呢……

f*******3
发帖数: 206

来自主题: Statistics版 - SAS的前景可怕吗？

流口水，这位仁兄方便展开讲讲你提到的Hive2+hadoop2+SAS9.4是怎么架构的，是统计
师做的还是engineer做的，处理什么问题，这种处理方式效率如何，是production
level的code还是只为分析用的？

p*******i
发帖数: 1181

来自主题: Statistics版 - SAS的前景可怕吗？

这个是Engineer组做的，主要目的是real time data analytic platform, 对server端
的大量raw data（跟我们组相关的大概是100多个T，其他组还有不少data在上面），用
Hive2调用hadoop2来访问，然后输出的data通过SAS提供的Hive接口直接导入SAS，基本
上就是说从百来个T里面筛选出几十个G的数据做summary可以全程在SAS里完成，速度基
本上能控制在一小时之内。当然这个速度完全是通过Hive的分块和hadoop的map reduce
实现的，SAS只是提供了调用接口。具体coding显然不是一两个data scientist能完成
的了，所以要是没有足够的support engineer team，统计师在IT公司还是相当尴尬的
……

s*****h
发帖数: 44903

来自主题: WBCenter版 - Soccer版申请代发2016年5月水枪奖励

注：1）版面活动：手续费无；个人申请：手续费10%；:
1)
代发版面/ID::
Soccer版
代发事由(主题标题及链接，如有链接必须附上链接)::
2016年5月水枪奖励
http://www.mitbbs.com/article_t/Soccer/34113383.html
赞助（有：附链接。没有：无）::
无
楼主是否计入统计（如不填写，默认否）::
是
奖励金额（需注明扣除伪币来源）::
（请从版库扣除）
备注::
以下ID每人奖励100伪币
1 ironcat 94 77.7% (10) 49 (1) 0.52 (20)
2 zhangjianshi 89 9.0% (41) 22 (8) 0.25 (40)
3 Marzman 78 42.4% (20) 46 (2) 0.59 (10)
4 xmseraph 66 34.7% (23) 24 (7) 0.36 (30)
5 Szymczak 64 65.3% (14) 20 (1... 阅读全帖

m*********k
发帖数: 10521

来自主题: WBCenter版 - Soccer版申请代发2016年5月水枪奖励

"[Soccer]sunfish Jun 1 ● Soccer版5月水枪包"
成功奖励 100 伪币的用户: ironcat, zhangjianshi, Marzman, xmseraph, Szymczak,
Bernanke, jazztech, iamright, usaut, wewill2009, ridgway
成功奖励 50 伪币的用户: Urus, lookacar, moliniao, jzlian, pee, OneFlyingPig,
imcowbee, lizzyreal, zaa, bbdou, vandieman, eightmile, desertking,
holydistance, metalchurch, xzilch, HOTDELL, sunfish, withoutacar
成功奖励 20 伪币的用户: hadoop2, PNH689, wwj, ricst1985, franey, HQ, evga,
Simeone, philchenko, awaydream, withoutcar, swanswan, kreisler,... 阅读全帖

B*****g
发帖数: 34098

来自主题: DataSciences版 - hadoop生产环境

用一个node的都是hadoop1，建议搞hadoop2

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

topics

未名新帖统计// 7月16日

历史上的今天