由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 【新手问题】Cassandra-Spark 哪个connector最好?
相关主题
Cassandra 真是狗屎学了一个周末Cassandra,顺利拿到certificate
谁用过Playorm 连nosql数据库大牛讲讲Cassandra client
Spark 和 Dynamodb 之间 如何 连接能用angularJS做前台java做后台吧?
谁有个save protocolbuf class from spark streaming to cassan (转载)mongoDB跟传统关系数据库比有什么优势?
去了Java one 两天的感想。Re: 问Zhaoce个问题 (转载)
Cassandra到底是不是schemaless?请大牛来谈谈对Solr的看法
persistence的选择还是别争了,从旁观者角度看,两个方案没准都能工作
是否值得把业务逻辑做到Hbase coprocessor里面?鄙视芒果的被打脸了
相关话题的讨论汇总
话题: connector话题: cassandra话题: cql话题: api话题: spark
进入Programming版参与讨论
1 (共1页)
s*****y
发帖数: 11
1
目前在用datastax的connector,https://github.com/datastax/spark-cassandra-
connector,问题是感觉API好像很少,文档中只看到了saveToCassandra,select,
collect几个API,像update之类的操作,没有看到相应的API?
还有一个问题就是datastax的connector好像同时支持CQL操作和sparkSQL操作,这两个
有啥区别吗?
p*****2
发帖数: 21240
2
还有其他选择吗?
cql run在cassandra

【在 s*****y 的大作中提到】
: 目前在用datastax的connector,https://github.com/datastax/spark-cassandra-
: connector,问题是感觉API好像很少,文档中只看到了saveToCassandra,select,
: collect几个API,像update之类的操作,没有看到相应的API?
: 还有一个问题就是datastax的connector好像同时支持CQL操作和sparkSQL操作,这两个
: 有啥区别吗?

s*****y
发帖数: 11
3
性能层面上CQL操作和sparkSQL操作哪个更好呢?
其他选择还挺多的,我知道的有:
http://www.stratio.com/deep-vs-datastax/
https://github.com/Stratio/deep-spark
别的我忘了。。。。。
z****e
发帖数: 54598
4
其实我个人挺讨厌ql的
我喜欢直接上java代码
哪怕是fp都比ql容易搞一点
ql貌似很简单,其实复杂的逻辑一加进去
就会很恶心
p*****2
发帖数: 21240
5
我没有具体研究过
不过我的理解是cql可以减少data size
我不觉得两个可以互换使用

【在 s*****y 的大作中提到】
: 性能层面上CQL操作和sparkSQL操作哪个更好呢?
: 其他选择还挺多的,我知道的有:
: http://www.stratio.com/deep-vs-datastax/
: https://github.com/Stratio/deep-spark
: 别的我忘了。。。。。

z****e
发帖数: 54598
6
对了,nosql时代,update可以通过time stamp来实现
一般抛弃了delete这种思维方式,尽量不删东西,只增
update也是只加,不删,想要update&delete,用db比较好
w**z
发帖数: 8232
7
我同意。
不过原因不一样,我一直觉得,要用好Cassandra, 一定要理解它是怎么存数据,怎么
取数据。要不然,可能会搞砸。但CQL 恰恰把这部分给封装起来,搞得跟RDMS似的,可
能会祸害不少人。

【在 z****e 的大作中提到】
: 其实我个人挺讨厌ql的
: 我喜欢直接上java代码
: 哪怕是fp都比ql容易搞一点
: ql貌似很简单,其实复杂的逻辑一加进去
: 就会很恶心

g*****g
发帖数: 34805
8
必须的。但这个方向是正确的。先吸引人过来,坑进去,再慢慢学习怎么爬出来。

【在 w**z 的大作中提到】
: 我同意。
: 不过原因不一样,我一直觉得,要用好Cassandra, 一定要理解它是怎么存数据,怎么
: 取数据。要不然,可能会搞砸。但CQL 恰恰把这部分给封装起来,搞得跟RDMS似的,可
: 能会祸害不少人。

w**z
发帖数: 8232
9
我们公司刚找了个Datastax 的solution architect 来给我们training. 丫估计刚开始
没多久, 只说CQL, 不提底下怎么存的。 有些基本概念都不是很清楚,就出来忽悠。
要不是俺亲手搞过Cassandra, 还真给Y的闷了。但不知道这货还会祸害多少公司。丫
懂得不如俺多,也出来给人training。
要不, 霸哥, 咱也整个consulting company, 出来忽悠?

【在 g*****g 的大作中提到】
: 必须的。但这个方向是正确的。先吸引人过来,坑进去,再慢慢学习怎么爬出来。
g*****g
发帖数: 34805
10
咱能力足够了,人脉差一点。估计只能养活自己。还不如弄个startup忽悠VC呢。

【在 w**z 的大作中提到】
: 我们公司刚找了个Datastax 的solution architect 来给我们training. 丫估计刚开始
: 没多久, 只说CQL, 不提底下怎么存的。 有些基本概念都不是很清楚,就出来忽悠。
: 要不是俺亲手搞过Cassandra, 还真给Y的闷了。但不知道这货还会祸害多少公司。丫
: 懂得不如俺多,也出来给人training。
: 要不, 霸哥, 咱也整个consulting company, 出来忽悠?

y**********u
发帖数: 6366
11
这哥们是Berkeley的吗?

【在 w**z 的大作中提到】
: 我们公司刚找了个Datastax 的solution architect 来给我们training. 丫估计刚开始
: 没多久, 只说CQL, 不提底下怎么存的。 有些基本概念都不是很清楚,就出来忽悠。
: 要不是俺亲手搞过Cassandra, 还真给Y的闷了。但不知道这货还会祸害多少公司。丫
: 懂得不如俺多,也出来给人training。
: 要不, 霸哥, 咱也整个consulting company, 出来忽悠?

1 (共1页)
进入Programming版参与讨论
相关主题
鄙视芒果的被打脸了去了Java one 两天的感想。
开源的轮子Cassandra到底是不是schemaless?
Why You Should Never Use MongoDBpersistence的选择
wwzz来讲讲cassandra吧是否值得把业务逻辑做到Hbase coprocessor里面?
Cassandra 真是狗屎学了一个周末Cassandra,顺利拿到certificate
谁用过Playorm 连nosql数据库大牛讲讲Cassandra client
Spark 和 Dynamodb 之间 如何 连接能用angularJS做前台java做后台吧?
谁有个save protocolbuf class from spark streaming to cassan (转载)mongoDB跟传统关系数据库比有什么优势?
相关话题的讨论汇总
话题: connector话题: cassandra话题: cql话题: api话题: spark