大数据这个东西，如果用hive，岂不是跟SQL差不多了 - DataSciences版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

DataSciences版 - 大数据这个东西，如果用hive，岂不是跟SQL差不多了

相关主题
● 请问大家有没有直接用java全程写mapreduce的程序的？	● 讨论，（Big）Data Engineer到底是个什么职位
● 如何学习Hadoop?	● data scientist对sql要求高吗
● 求Hadoop项目练手	● 请问有没有Pig Hive Hadoop SQL的速成课？
● 有没有谁自己买服务器组建几个clusters跑hadoop大数据的？	● 请问data scientist 相关职务，面试要准备什么?
● Hadoop Spark 学习小结[2014版] (转载)	● 是不是什么spark,统计模型学完了才能干大型数据分析
● Hadoop Spark 学习小结[2014版] (转载)	● 三星samsung创新部门招大数据工程师 (转载)
● big data software engineer或者data scientist 工作机会推荐 (转载)	● Re: MapR Technologies continue hiring a lot of positions (转载)
● 一个关于big data 系统架构的设计问题	● 求职求内推

相关话题的讨论汇总
话题: hive话题: sql话题: 数据话题: hadoop话题: 岂不是

进入DataSciences版参与讨论

1

(共1页)

l******n 发帖数: 1250	1 发现所有data scientist 的position 都要求大数据,hadoop 什么的经验，还特别重要可是，如果hadoop的经验，是指用Hive做query 和 summary, 那根用SQL command没多少区别啊。可能在底层，hadoop和relation database 差距很大，但是在上层，用hive 的话，这个差距可以说很小很小。如果是写pig，确实有些不太一样，但也不是那么难学，至少比学编程练算法容易多了。总之，这个要求“大数据”的经验，我感觉就是一个样子货，没啥真的内涵。请大家发表意见
T*****u 发帖数: 7103	2 第一这个东西还处于初级阶段,只能局部上突破一下,别幻想太多第二它就是差不多第三数据大小是个限制条件,限制越多,trade off越多,能做的就越少,但多少做点比不做好
m******a 发帖数: 77	3 这个说的精辟【在 T*****u 的大作中提到】 : 第一这个东西还处于初级阶段,只能局部上突破一下,别幻想太多 : 第二它就是差不多 : 第三数据大小是个限制条件,限制越多,trade off越多,能做的就越少,但多少做点比不 : 做好
B********r 发帖数: 397	4 都哪年了还用hive，hadoop？赶紧上C* + SPARK ，速度 X 100
w**2 发帖数: 147	5 除非数据是大到了一定的程度，不然用hive不见得更快。同意楼上，spark才是出路。
n*****3 发帖数: 1584	6 ETL还是要 hive impala 吧【在 w**2 的大作中提到】 : 除非数据是大到了一定的程度，不然用hive不见得更快。 : 同意楼上，spark才是出路。
o********r 发帖数: 193	7 agree hive 了。【在 l******n 的大作中提到】 : 发现所有data scientist 的position 都要求大数据,hadoop 什么的经验，还特别重要 : 可是，如果hadoop的经验，是指用Hive做query 和 summary, 那根用SQL command没多 : 少区别啊。可能在底层，hadoop和relation database 差距很大，但是在上层，用hive : 的话，这个差距可以说很小很小。 : 如果是写pig，确实有些不太一样，但也不是那么难学，至少比学编程练算法容易多了。 : 总之，这个要求“大数据”的经验，我感觉就是一个样子货，没啥真的内涵。 : 请大家发表意见
h*********d 发帖数: 109	8 hive 了。【在 l******n 的大作中提到】 : 发现所有data scientist 的position 都要求大数据,hadoop 什么的经验，还特别重要 : 可是，如果hadoop的经验，是指用Hive做query 和 summary, 那根用SQL command没多 : 少区别啊。可能在底层，hadoop和relation database 差距很大，但是在上层，用hive : 的话，这个差距可以说很小很小。 : 如果是写pig，确实有些不太一样，但也不是那么难学，至少比学编程练算法容易多了。 : 总之，这个要求“大数据”的经验，我感觉就是一个样子货，没啥真的内涵。 : 请大家发表意见
f********r 发帖数: 304	9 spark也要数据大才有用，不然光scan HDFS上的input path就可以运行很久，假设你有很多partitions，文件很散碎
j********p 发帖数: 9680	10 有道理,就是基于非关系型数据的类SQL语言. Hadoop速度慢,不要紧,可以作为数据存储. spark作为实时运算端.

1

(共1页)

进入DataSciences版参与讨论

相关主题
● 求职求内推	● Hadoop Spark 学习小结[2014版] (转载)
● 油管上这个教学视频介绍Hadoop HDFS讲得不错！	● Hadoop Spark 学习小结[2014版] (转载)
● 做个调查了解一下，有公司用HP Vertica 和 Hana 这些 data base的么？	● big data software engineer或者data scientist 工作机会推荐 (转载)
● 一个白痴问题，如何把access的表格导入hadoop里面去	● 一个关于big data 系统架构的设计问题
● 请问大家有没有直接用java全程写mapreduce的程序的？	● 讨论，（Big）Data Engineer到底是个什么职位
● 如何学习Hadoop?	● data scientist对sql要求高吗
● 求Hadoop项目练手	● 请问有没有Pig Hive Hadoop SQL的速成课？
● 有没有谁自己买服务器组建几个clusters跑hadoop大数据的？	● 请问data scientist 相关职务，面试要准备什么?

相关话题的讨论汇总
话题: hive话题: sql话题: 数据话题: hadoop话题: 岂不是

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)