w**z 发帖数: 8232 | 1 Look at this overall ranking:
http://db-engines.com/en/ranking
shall we all move to MS SQL Server since it's up 20% for last month?
Rank Last Month DBMS Database Model Score Changes
1. 1. Oracle Relational DBMS 1467.79 -0.26
2. 2. MySQL Relational DBMS 1296.91 -12.38
3. 3. Microsoft SQL Server Relational DBMS 1226.02 +20.
14
4. 4. PostgreSQL Relational DBMS 228.25 -2.71
5. 5. DB2 Relation... 阅读全帖 |
|
p*****2 发帖数: 21240 | 2
queue
robomongo我们组有人用,不过好像有问题。我让他用mongshell就没事了。
官方例子都是JS,还有平时在shell上也都是JS,所以JS还是最方便,这个确实是。我
用Ruby还是要多花不少时间的。
sharding我也没用过,感觉比较麻烦一些,没有cassandra啥的方便。不过能通过堆
machine scale也很不错了。很省人工。我用replicaset倒是。 |
|
|
n****1 发帖数: 1136 | 4 Cassandra可以选择各种Read mode. 速度取决于你是否能接受eventual consistency.
Full consistency的benchmark你要另外找.
但我感觉"Real time"和"Eventual Consistency"好像是很矛盾的.
logs |
|
g*****g 发帖数: 34805 | 5 And Cassandra is tunable consistency, Read/Write quorum can achieve strong
consistency and fast read/write.
i.e. Most operations under 10ms regardless of total data size.
. |
|
m***h 发帖数: 77 | 6 今天看到国内前淘宝的工程师讲1230的复杂度,
瞎想一下(结构一旦搭好,很难改变),
技术(tech stack, architecture)决定于需求(requirements),
而“所谓”的需求受制于个别人的背景,视野,以及对用户,产品,市场的理解,尤其
是局限于人为分割来的两个截然不同的group,造成business side只懂得比猫画虎,
technology side则醉心于技术喜欢拿着hammer找nail,而用户呢,分不清想要的和需
要的。
user说他想要一张火车票,他说他要20号广州到贵阳的票,
其实他真正想要的是回家(但他不会这么告所你.
20号没有,21,22也可以“接受”,是在不行站票也可以!(这个场景在火车站售票窗
口循环上演,decision making in 20 seconds).
铁路春运票务系统首要gurantee的是保证你回家,保证每个人都不费力的得到一张回家
的票,至于20,21还是22是次要的
这和淘宝双十恰恰是相反的-淘宝的用户要的是那个exact deal,如果买不到也无所谓。
所以用淘宝或online store的思路做春运票务,... 阅读全帖 |
|
|
z****e 发帖数: 54598 | 8 couchdb简单啊
不过我不喜欢阿
我喜欢cassandra |
|
d*******r 发帖数: 3299 | 9 看来你们 MongoDB 用得比较深入,请问有碰到大家说的那些问题么。
比如写 lock 严重影响效率,updating fields 慢,index 沾满内存。
我觉得 mongoDB 也好多个版本了吧,不知道现在改进得如何了。我在用,只是还没大
规模上 sharding.
mongodb 如果小心配置的话,应该还是用着不错的?
我总觉得 mongoDB 真心是 Cassandra 流行多了。还融资了上亿,看着前景还不错的样
子。
大牛能不能说说最不满意mongoDB的地方是哪里?
, |
|
|
p*****2 发帖数: 21240 | 11
不知道为什么这个公司这两天在L上联系我,问我用不用Cassandra, 我说我用Mongo,
然后他就跟我说了跟你一样的话。 |
|
d*******r 发帖数: 3299 | 12 对于分布式的backend servers,做一般性的logging,实时要求不高,要能scale out
,在logging里面搜索要方便。
请问大牛们,这2个哪个比较好。
貌似 ElasticSearch 那一套看着很完善了: logstash (JRuby) -> ElasticSearch ->
kibana (GUI)
http://www.elasticsearch.org/overview/
用的话, 不需要去折腾 Ruby gems 什么的吧,我看了下,好像不需要折腾 Ruby
ElasticSearch 这一套看官网介绍,还能跑 hadoop?
另外,ElasticSearch 公司哪些服务要收钱的?
Cassandra 的话,写效率高
请板上大牛们评比下这2个轮子哪个做一般 log 比较好 |
|
p*****2 发帖数: 21240 | 13 先写cassandra再倒入到elastic search也可以吧? |
|
d*******r 发帖数: 3299 | 14 那二爷你是把 cassandra 当 buffer 用咯? |
|
d*******r 发帖数: 3299 | 15 那你先写到 Cassandra, 再写到 ElasticSearch, 瓶颈不还是在 ElasticSearch 吗 |
|
g*****g 发帖数: 34805 | 16 我见过的不是为了ES去选DB, 而是DB的选择跟着你的商业逻辑需要来。然后service在
写DB的时候同时产生一个event, 把更新发给ES. 所以用什么数据库其实无关。我们用
的MySQL, Cassandra都有。其他team也有用MongoDB的。 |
|
|
p*****2 发帖数: 21240 | 18
是。我们公司不用cassandra。很多support都没有,都要自己折腾。不过感觉大数据的
时候应该考虑。 |
|
z****e 发帖数: 54598 | 19 cassandra
不过这是multiple masters system |
|
w***g 发帖数: 5958 | 20
------------------------------------------------
A down了的情况可以允许从B读不到数据。但是我觉得能做到A在线的话永远优先从A读。
本来cassandra的latency已经比别人差一大截了。要是上quorum write就更不行了。我
一个请求来回也就几十毫秒的时间可以用。 |
|
w***g 发帖数: 5958 | 21 redis-benchmark很好用。cassandra有类似的东西可以用吗?
< |
|
|
c********l 发帖数: 8138 | 23 好像根本就是不一样的东西,
HBase侧重于大数据的存储
Cassandra侧重于query/analysis
如果说得不对请轻拍 |
|
p*****2 发帖数: 21240 | 24 希望这样 准备上cassandra可了 HBase 比Java还无聊 |
|
s***o 发帖数: 2191 | 25 二爷的学习能力真不是盖的。我一个周末估计也就勉强能做到把cassandra这个词拼对 |
|
d*******r 发帖数: 3299 | 26 以前看到过这个,以为就是一个fancy的 Cassandra GUI 呢 |
|
p*****2 发帖数: 21240 | 27 经常看到你说不精通cassandra的用cql很危险 能不能具体谈谈 也造福一下我们这些新
手 少走弯路 |
|
g*****g 发帖数: 34805 | 28 了解一下Cassandra适用于什么类型的数据,不适合什么类型的数据,常见的数据怎么
组织schema,比如time series。NoSQL的精髓在于灵活运用,从分析自己的数据类型入
手,而不是拿个锤子啥都是钉
子。 |
|
p*****2 发帖数: 21240 | 29 Node跟Cassandra配合不要太容易了
HBase用Clojure做都搞不定
看来CANE stack要流行了。 |
|
p*****2 发帖数: 21240 | 30
大牛out了吧?
Cassandra/Coffee
AngularJS
Node.js
Express |
|
h**j 发帖数: 2033 | 31 cqlsh:testks> show version
[cqlsh 4.1.1 | Cassandra 2.0.6 | CQL spec 3.1.1 | Thrift protocol 19.39.0]
用了helenus和astyanax都一样,row key都是null,都指定了target version 1.2 和
CQL3.
[ ,
]
key作为一个column返回,by design? |
|
B********r 发帖数: 397 | 32
那一个column family 里面的 partition 的数目是跟整个cluster node 数目相同么,
还是自己设置? apache kafka 里面是可以自己设置partition number, cassandra 也
是一样么?
多谢! |
|
w**z 发帖数: 8232 | 33 in Cassandra, one row has to be in one node. you can replicate the whole row
, but each row has to fit in one physical node.
a |
|
B********r 发帖数: 397 | 34 谢了各位大神, 还有个问题想讨论下,关于cassandra 2.0 之后thrift与CQL3 的区别
,是说只是client里面有差别还是server side也变了? protocol应该是不变的吧?
之前我想动态的加一个column很方便,用cli的话就是: set table[key][columnName]
= columnValue
现在必须alter table, 还是也可以用那种方法? |
|
|
w**z 发帖数: 8232 | 36 Cassandra 的data 是sequential 存在disk上的,你改schema,影响比较大。 |
|
c******o 发帖数: 1277 | 37 没转,这东西哪那么每个月换。
二爷是特例。
我们有些小的东西用Dynamodb, 两个也是不一样的东西,没啥好比的。
Dynamodb省心是啥amazon都包了,你就用和付钱就好了。
自己做mongo scalability/availability/backup/restore 可麻烦了, 我们两个devopt
人2个月做这个自动化,昨晚倒是容易了,不需要专人了。
cassandra据我所知容易很多scalability/availability, 但是backup/restore 也很
麻烦。 |
|
w**z 发帖数: 8232 | 38 Cassandra 一般RF 设成3,就不需要专门backup 了。一个node 挂了, 换个上去就行
了。 有了 vnode, 就更方便了。
devopt |
|
w**z 发帖数: 8232 | 39 backup 还是有的,好像Cassandra 本身带这功能。在production环境里,还没用上过
。backup只是在disaster recovery 时才用得上。一般不会在production 里乱来的。 |
|
c******o 发帖数: 1277 | 40 cassandra 是 eventually consistent,你可以改behavior,但是default 写进去过一段
才能一致的读出来。
这个很正常,取决于用途。
hbase是consistent,但是不是availability (某种意义上有lock)两个不一样。 |
|
|
p*****2 发帖数: 21240 | 42 其实Cassandra是没有schema的,但是有了CQL以后就有schema了。 |
|
A*****i 发帖数: 3587 | 43 曾经总改cassandra 的schema的飘过 |
|
t**r 发帖数: 3428 | 44 mongo,dynamo,cassandra,hbase 谁会是赢家,谁会落寞? |
|
|
n*w 发帖数: 3393 | 46 有的项目不大不小了的。
小项目用cassandra有什么不方便的地方? |
|
p*****2 发帖数: 21240 | 47 cassandra要配es或者spark 跟mongo比要heavy很多了 不大不小看数据量多大了 想
scale到什么程度了 |
|
S*******e 发帖数: 525 | 48 有一点进展 -- “官方”的jdbc 1.2.5 与 Canssandra 2.1 不能合作很好(如果表里
有Timestamp field, 就会出错 )。 这儿的https://code.google.com/a/apache-
extras.org/p/cassandra-jdbc/ 没有这个问题。这里的同志们如遇类似问题, 这也许
会有点帮助。
它的spark Connectors任何版本都不能和Spark 1.1 合作-- 各种各样的问题 (有些
可能涉及我这个系统的现有设置:每个机器有多个网卡和多个IPs)。
二爷和大家说的也都很有道理:其实新东西都不很容易,这就需要自己多动主意了。 |
|
w**z 发帖数: 8232 | 49 hbase 不懂 Cassandra 用 JDBC 是自虐。 |
|
g*****g 发帖数: 34805 | 50 用开源的东西要用点脑子研究一下啥稳定,啥不行。你用CQL Driver, Hector,
Astyanax都算稳定的Client. 这所谓Cassandra-jdbc明显是第三方,没几个用户也没几
个commit, 而且一年多没更新了。 |
|