由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - Apache Beam bs Apache spark
相关主题
从版上的讨论想到开源项目请问关于top level Apache project
groovy好像交给apache了open source的开发者到底拿什么养活老婆孩子?
大牛们有人玩apache beam吗GPL是不是也是open source发展的一个阻力
狗的dataflow是什么求开源的通用PHP的Apache程序用于MySQL查询操作
akka/scala/jvmR李怎么搞big data和deep learning?
spark就是因为吃饱了要做rdd成immutable导致了无法实现真正意义上的stream processing吧?Apache spark online course
给诸位一个亿美元开一个startup,你们会去做什么?大牛讲讲mongoDB这种开源的怎么赚钱?
银行的所谓 data scientist 真他妈水vertx3.1出来可以秒杀golang 了?
相关话题的讨论汇总
话题: apache话题: spark话题: beam话题: dataflow话题: 开源
进入Programming版参与讨论
1 (共1页)
a******n
发帖数: 5925
1
https://mpouttuclarke.wordpress.com/2016/02/06/apache-beam-vs-apache-spark-
comparison/
话说Apache 真无私, 收的干儿子们从不护犊子
反正都是收的。有更好的干儿子照样收。
f******2
发帖数: 2455
2
google在云计算上决定放手一博,这个只是collateral damage

【在 a******n 的大作中提到】
: https://mpouttuclarke.wordpress.com/2016/02/06/apache-beam-vs-apache-spark-
: comparison/
: 话说Apache 真无私, 收的干儿子们从不护犊子
: 反正都是收的。有更好的干儿子照样收。

x***4
发帖数: 1815
3
一般google比开源社区领先3年左右。

【在 a******n 的大作中提到】
: https://mpouttuclarke.wordpress.com/2016/02/06/apache-beam-vs-apache-spark-
: comparison/
: 话说Apache 真无私, 收的干儿子们从不护犊子
: 反正都是收的。有更好的干儿子照样收。

f******2
发帖数: 2455
4
看了一下incubation的goal description,感觉google还是就想开源个壳子就把客户赢
过来,估计不会成功。
首先,在这里把spark批评一把:https://cloud.google.com/dataflow/blog/dataflow
-beam-and-spark-comparison
然后,在这里想把spark一统到自己的programming model下来:https://wiki.apache.
org/incubator/BeamProposal
感觉完全不顾databrick的感受。
而且dataflow的server side根本没有开源计划。这就好像azure说,我开源了azure客
户段
,而且是apache项目,你们不要用aws啦。
这么搞在云计算上没法翻盘。

【在 x***4 的大作中提到】
: 一般google比开源社区领先3年左右。
N*****m
发帖数: 42603
5
就是DataFlow的DSL开源了,好几个星期前的事了
现在搞了个beam的名字
引擎没有开源,然后可以在它自家的DF Service上跑
也可以把spark, flink当引擎

dataflow
apache.

【在 f******2 的大作中提到】
: 看了一下incubation的goal description,感觉google还是就想开源个壳子就把客户赢
: 过来,估计不会成功。
: 首先,在这里把spark批评一把:https://cloud.google.com/dataflow/blog/dataflow
: -beam-and-spark-comparison
: 然后,在这里想把spark一统到自己的programming model下来:https://wiki.apache.
: org/incubator/BeamProposal
: 感觉完全不顾databrick的感受。
: 而且dataflow的server side根本没有开源计划。这就好像azure说,我开源了azure客
: 户段
: ,而且是apache项目,你们不要用aws啦。

f******2
发帖数: 2455
6
对呀,就是博眼球。
Google真的需要雇个好点儿的open source strategist

【在 N*****m 的大作中提到】
: 就是DataFlow的DSL开源了,好几个星期前的事了
: 现在搞了个beam的名字
: 引擎没有开源,然后可以在它自家的DF Service上跑
: 也可以把spark, flink当引擎
:
: dataflow
: apache.

g****s
发帖数: 340
7
感觉这个策略不错啊,在自己的cluster上跑用fink,spark,想效率高用cloud
dataflow。
话说狗家的stack太独特了,build system open source了几个月还在beta。想open
source一个更高层的tech要花很多时间。
N*****m
发帖数: 42603
8
毕竟是后来的,只有这个办法了

【在 g****s 的大作中提到】
: 感觉这个策略不错啊,在自己的cluster上跑用fink,spark,想效率高用cloud
: dataflow。
: 话说狗家的stack太独特了,build system open source了几个月还在beta。想open
: source一个更高层的tech要花很多时间。

1 (共1页)
进入Programming版参与讨论
相关主题
vertx3.1出来可以秒杀golang 了?akka/scala/jvm
各位大牛,Apache Apex 怎么样?spark就是因为吃饱了要做rdd成immutable导致了无法实现真正意义上的stream processing吧?
搞数据的变化太快给诸位一个亿美元开一个startup,你们会去做什么?
Big data question银行的所谓 data scientist 真他妈水
从版上的讨论想到开源项目请问关于top level Apache project
groovy好像交给apache了open source的开发者到底拿什么养活老婆孩子?
大牛们有人玩apache beam吗GPL是不是也是open source发展的一个阻力
狗的dataflow是什么求开源的通用PHP的Apache程序用于MySQL查询操作
相关话题的讨论汇总
话题: apache话题: spark话题: beam话题: dataflow话题: 开源