G*******e 发帖数: 80 | 1 搞big data的大牛们来说说还有公司会在新项目选择mapReduce吗?相对spark是不是完
全处于被替代的位置?除了spark你们还在用什么? |
r*****s 发帖数: 1815 | 2 很多时候离线就够了哈
那数据别说迟上几个小时,迟上两天都没人注意。。。。 |
a*****s 发帖数: 1121 | 3 spark 后台也用的是mapreduce的原理,甚至很多类都是直接拿hadoop的用的。只能说
spark是mapreduce的内存优化版。可惜了hortonworks不知道继续优化mapreduce来给用
户免费午餐,并且直接打败databricks,而是搞什么tez,缺乏战略眼光。如果继续优
化mapreduce,现有MR用户不用修改源代码就可以得到10倍以上的性能提升,谁还去用
spark。
有时候不是对手多强大,而是自己多傻逼。 |
p*********g 发帖数: 2998 | 4 if file size is huge big and your cluster is huge small, the data cannot be
saved in the memory at all. Mapreduce is much faster than spark |
f*****z 发帖数: 13 | 5
be
Saprk + meso
【在 p*********g 的大作中提到】 : if file size is huge big and your cluster is huge small, the data cannot be : saved in the memory at all. Mapreduce is much faster than spark
|