由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 大数据这个东西,如果用hive,岂不是跟SQL差不多了
相关主题
请问大家有没有直接用java全程写mapreduce的程序的?讨论,(Big)Data Engineer到底是个什么职位
如何学习Hadoop?data scientist对sql要求高吗
求Hadoop项目练手请问有没有Pig Hive Hadoop SQL的速成课?
有没有谁自己买服务器组建几个clusters跑hadoop大数据的?请问data scientist 相关职务,面试要准备什么?
Hadoop Spark 学习小结[2014版] (转载)是不是什么spark,统计模型学完了才能干大型数据分析
Hadoop Spark 学习小结[2014版] (转载)三星samsung创新部门招大数据工程师 (转载)
big data software engineer或者data scientist 工作机会推荐 (转载)Re: MapR Technologies continue hiring a lot of positions (转载)
一个关于big data 系统架构的设计问题求职求内推
相关话题的讨论汇总
话题: hive话题: sql话题: 数据话题: hadoop话题: 岂不是
进入DataSciences版参与讨论
1 (共1页)
l******n
发帖数: 1250
1
发现所有data scientist 的position 都要求大数据,hadoop 什么的经验,还特别重要
可是,如果hadoop的经验,是指用Hive做query 和 summary, 那根用SQL command没多
少区别啊。可能在底层,hadoop和relation database 差距很大,但是在上层,用hive
的话,这个差距可以说很小很小。
如果是写pig,确实有些不太一样,但也不是那么难学,至少比学编程练算法容易多了。
总之,这个要求“大数据”的经验,我感觉就是一个样子货,没啥真的内涵。
请大家发表意见
T*****u
发帖数: 7103
2
第一这个东西还处于初级阶段,只能局部上突破一下,别幻想太多
第二它就是差不多
第三数据大小是个限制条件,限制越多,trade off越多,能做的就越少,但多少做点比不
做好
m******a
发帖数: 77
3
这个说的精辟

【在 T*****u 的大作中提到】
: 第一这个东西还处于初级阶段,只能局部上突破一下,别幻想太多
: 第二它就是差不多
: 第三数据大小是个限制条件,限制越多,trade off越多,能做的就越少,但多少做点比不
: 做好

B********r
发帖数: 397
4
都哪年了还用hive,hadoop? 赶紧上C* + SPARK ,速度 X 100
w**2
发帖数: 147
5
除非数据是大到了一定的程度,不然用hive不见得更快。
同意楼上,spark才是出路。
n*****3
发帖数: 1584
6
ETL还是要 hive impala 吧

【在 w**2 的大作中提到】
: 除非数据是大到了一定的程度,不然用hive不见得更快。
: 同意楼上,spark才是出路。

o********r
发帖数: 193
7
agree

hive
了。

【在 l******n 的大作中提到】
: 发现所有data scientist 的position 都要求大数据,hadoop 什么的经验,还特别重要
: 可是,如果hadoop的经验,是指用Hive做query 和 summary, 那根用SQL command没多
: 少区别啊。可能在底层,hadoop和relation database 差距很大,但是在上层,用hive
: 的话,这个差距可以说很小很小。
: 如果是写pig,确实有些不太一样,但也不是那么难学,至少比学编程练算法容易多了。
: 总之,这个要求“大数据”的经验,我感觉就是一个样子货,没啥真的内涵。
: 请大家发表意见

h*********d
发帖数: 109
8

hive
了。

【在 l******n 的大作中提到】
: 发现所有data scientist 的position 都要求大数据,hadoop 什么的经验,还特别重要
: 可是,如果hadoop的经验,是指用Hive做query 和 summary, 那根用SQL command没多
: 少区别啊。可能在底层,hadoop和relation database 差距很大,但是在上层,用hive
: 的话,这个差距可以说很小很小。
: 如果是写pig,确实有些不太一样,但也不是那么难学,至少比学编程练算法容易多了。
: 总之,这个要求“大数据”的经验,我感觉就是一个样子货,没啥真的内涵。
: 请大家发表意见

f********r
发帖数: 304
9
spark也要数据大才有用,不然光scan HDFS上的input path就可以运行很久,假设你有
很多partitions,文件很散碎
j********p
发帖数: 9680
10
有道理,就是基于非关系型数据的类SQL语言.
Hadoop速度慢,不要紧,可以作为数据存储.
spark作为实时运算端.
1 (共1页)
进入DataSciences版参与讨论
相关主题
求职求内推Hadoop Spark 学习小结[2014版] (转载)
油管上这个教学视频介绍Hadoop HDFS讲得不错!Hadoop Spark 学习小结[2014版] (转载)
做个调查了解一下,有公司用HP Vertica 和 Hana 这些 data base的么?big data software engineer或者data scientist 工作机会推荐 (转载)
一个白痴问题,如何把access的表格 导入hadoop里面去一个关于big data 系统架构的设计问题
请问大家有没有直接用java全程写mapreduce的程序的?讨论,(Big)Data Engineer到底是个什么职位
如何学习Hadoop?data scientist对sql要求高吗
求Hadoop项目练手请问有没有Pig Hive Hadoop SQL的速成课?
有没有谁自己买服务器组建几个clusters跑hadoop大数据的?请问data scientist 相关职务,面试要准备什么?
相关话题的讨论汇总
话题: hive话题: sql话题: 数据话题: hadoop话题: 岂不是