由买买提看人间百态

topics

全部话题 - 话题: cassandra
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
w**z
发帖数: 8232
1
来自主题: Programming版 - Cassandra 真是狗屎
Hector 也不行了, 新feature 都不加了,但还算稳定。cql 用 datastax的, thrift
就用 Astyanax. 楼主明显对Cassandra 不熟, 上来就喷。
S*******e
发帖数: 525
2
来自主题: Programming版 - Cassandra 真是狗屎
多谢大牛这些信息。这些东西都是最近才接触--遇到这样那样的问题一时不太好解决。
试了datastax的spark connector, 不工作。再试它的CQL Driver,又遇到新问题 (
他们自己也知道,那个driver1.2.5 跟新版的Cassandra (2.x)有问题)。 这个第三
方driver 实际只是“官方”的patch。 这些暂时不是最重要的。。不是production。
我们想证明我们的一些分析算法在SPARK-HADOOP-R上能行得通。
S*******e
发帖数: 525
3
来自主题: Programming版 - Cassandra 真是狗屎
有一点进展 -- “官方”的jdbc 1.2.5 与 Canssandra 2.1 不能合作很好(如果表里
有Timestamp field, 就会出错 )。 这儿的https://code.google.com/a/apache-
extras.org/p/cassandra-jdbc/ 没有这个问题。这里的同志们如遇类似问题, 这也许
会有点帮助。
它的spark Connectors任何版本都不能和Spark 1.1 合作-- 各种各样的问题 (有些
可能涉及我这个系统的现有设置:每个机器有多个网卡和多个IPs)。
二爷和大家说的也都很有道理:其实新东西都不很容易,这就需要自己多动主意了。
w**z
发帖数: 8232
4
来自主题: Programming版 - Cassandra 真是狗屎
hbase 不懂 Cassandra 用 JDBC 是自虐。
g*****g
发帖数: 34805
5
来自主题: Programming版 - Cassandra 真是狗屎
用开源的东西要用点脑子研究一下啥稳定,啥不行。你用CQL Driver, Hector,
Astyanax都算稳定的Client. 这所谓Cassandra-jdbc明显是第三方,没几个用户也没几
个commit, 而且一年多没更新了。
w**z
发帖数: 8232
6
来自主题: Programming版 - Cassandra 真是狗屎
Hector 也不行了, 新feature 都不加了,但还算稳定。cql 用 datastax的, thrift
就用 Astyanax. 楼主明显对Cassandra 不熟, 上来就喷。
S*******e
发帖数: 525
7
来自主题: Programming版 - Cassandra 真是狗屎
多谢大牛这些信息。这些东西都是最近才接触--遇到这样那样的问题一时不太好解决。
试了datastax的spark connector, 不工作。再试它的CQL Driver,又遇到新问题 (
他们自己也知道,那个driver1.2.5 跟新版的Cassandra (2.x)有问题)。 这个第三
方driver 实际只是“官方”的patch。 这些暂时不是最重要的。。不是production。
我们想证明我们的一些分析算法在SPARK-HADOOP-R上能行得通。
s*****y
发帖数: 11
8
目前在用datastax的connector,https://github.com/datastax/spark-cassandra-
connector,问题是感觉API好像很少,文档中只看到了saveToCassandra,select,
collect几个API,像update之类的操作,没有看到相应的API?
还有一个问题就是datastax的connector好像同时支持CQL操作和sparkSQL操作,这两个
有啥区别吗?
p*****2
发帖数: 21240
9
还有其他选择吗?
cql run在cassandra
w**z
发帖数: 8232
10
我同意。
不过原因不一样,我一直觉得,要用好Cassandra, 一定要理解它是怎么存数据,怎么
取数据。要不然,可能会搞砸。但CQL 恰恰把这部分给封装起来,搞得跟RDMS似的,可
能会祸害不少人。
w**z
发帖数: 8232
11
我们公司刚找了个Datastax 的solution architect 来给我们training. 丫估计刚开始
没多久, 只说CQL, 不提底下怎么存的。 有些基本概念都不是很清楚,就出来忽悠。
要不是俺亲手搞过Cassandra, 还真给Y的闷了。但不知道这货还会祸害多少公司。丫
懂得不如俺多,也出来给人training。
要不, 霸哥, 咱也整个consulting company, 出来忽悠?
H******7
发帖数: 1728
12
来自主题: Programming版 - Cassandra vs mongo
Cassandra 比mongo难学很多么 区别大么
★ 发自iPhone App: ChineseWeb 8.7
g****v
发帖数: 971
13
大牛能不能讨论下cassandra, Hbase, MongoDB的对比
c******o
发帖数: 1277
w**z
发帖数: 8232
15
听说manage 起来很蛋疼。Cassandra 方便manage
T******7
发帖数: 1419
16
来自主题: Programming版 - 有人了解espresso 么 跟Cassandra 比呢
有人了解espresso 么 跟Cassandra 比呢
★ 发自iPhone App: ChineseWeb 8.7
p*****u
发帖数: 310
17
来自主题: Programming版 - 为什么facebook不用Cassandra
最近在看Cassandra,好像挺popular了的。但是为什么facebook自己不用了?
g*****g
发帖数: 34805
18
来自主题: Programming版 - 为什么facebook不用Cassandra
Cassandra当时远没有现在成熟。另外大系统数据库一旦定了很难走回头路。
e***m
发帖数: 92
19
来自主题: Programming版 - 为什么facebook不用Cassandra
Cassandra和Hbase到底哪个更成熟更有前途?网上搜到的帖子都给不出一个conclusive
的答案。
g*****g
发帖数: 34805
20
来自主题: Programming版 - 为什么facebook不用Cassandra
That's why its availability takes a hit. Cassandra is very different from
RDBMS, which make them complementary in many aspects.
c***5
发帖数: 158
21
来自主题: Programming版 - Cassandra vs MongoDB
请问现在CASSANDRA 和 MONGODB 哪个更流行?
p*****2
发帖数: 21240
22
来自主题: Programming版 - Cassandra vs MongoDB
mongo是nosql老大
不过cassandra是big data老大
C*******n
发帖数: 193
23
有人搞cassandra么。应付面试要掌握到什么程度?
自己玩过一些c*的东西,感觉不成体系
p*****2
发帖数: 21240
24
现在精通cassandra的应该不多
搞过就是bonus
g*****g
发帖数: 34805
25
来自主题: Programming版 - Cassandra Rewritten In C++, Ten Times Faster
http://www.eweek.com/database/scylladb-database-emerges-out-of-
"We're building a really fast database for NoSQL workloads," Kivity told
eWEEK. "ScyllaDB is 100 percent compatible with Cassandra, and applications
will run up to 10 times faster."

than
g*****g
发帖数: 34805
26
来自主题: Programming版 - Cassandra Rewritten In C++, Ten Times Faster
http://www.scylladb.com/technology/cassandra-vs-scylla-benchmar
看了这个benchmark,目测10倍是没有,8倍?但关键是misleading,没有人会单机跑C*
的,你最少也上3个节点。我怀疑replication会由Network IO latency主导,从而大幅
缩小差距,有可能会然并卵。举个例子就是network latency 1ms, 你kernel bypass
节省了0.1ms,绝对是然并卵。
吹嘘的单机sharding优化没有意义,一个机器当了就全当了,用C*的目的之一就是追求
high availability. 一份数据多机备份是必须的,这反过来直接说明cluster里,
replication factor > 1立马要大打折扣。
在cluster benchmark出来之前,我对这东西保持怀疑态度。
S*******e
发帖数: 525
27
来自主题: Programming版 - Cassandra Rewritten In C++, Ten Times Faster
From Slashdot:
Rewrites are easier than the first strike (Score:5, Insightful)
Wow, two years ago everyone here told us that NoSQL is evil and tried to
convince us that we should stick to MySQL.
Now everyone tells us Java is evil, because a rewrite in C++ is faster.
What a surprise.
If I would rewrite Cassandra from scratch, in Java, it also would be faster
than the actual code.
Why? Because all the learning the original team did over a course of a
decade I can reuse and improve on.
Keep in mind... 阅读全帖
h*i
发帖数: 3446
28
来自主题: Programming版 - Cassandra Rewritten In C++, Ten Times Faster
同意这个。nosql这种东西的好处就是多机,而多机主要的问题是网络的延迟和不可靠
,追求单机性能不是本末倒置么?
话说C*的分布式设计是有问题,具体见https://aphyr.com/posts/294-call-me-maybe-
cassandra/
但这些设计问题不是用C++写就能解决的。
这个对分布设计的Jepsen测试,目前测出来没问题的软件就只有zookeeper,其他被测
过的,C*, Mongo, Kafka,ES, Riak, Areospike, 等等, 全都有问题,partition都
会造成inconsistency。
常用的分布数据库里面,couchbase还没被测过,这个是用erlang写的网络部分,可能
没问题吧?还有就是被Apple买了的FoundationDB, 自己的测试就包括Jepsen,估计也
没有问题。

C*
h*i
发帖数: 3446
29
来自主题: Programming版 - Cassandra Rewritten In C++, Ten Times Faster
丢数据不能算是eventually consistent。数据都给我丢了,你自己eventual
consistent对我有什么用处?否则的话,100%数据丢失=100% guaranteed
consistency.
"No. Cassandra lightweight transactions are not even close to correct.
Depending on throughput, they may drop anywhere from 1-5% of acknowledged
writes–and this doesn’t even require a network partition to demonstrate.
It’s just a broken implementation of Paxos. "
c********l
发帖数: 125
30
来自主题: Programming版 - Cassandra Rewritten In C++, Ten Times Faster
cassandra summit为什么不搞成blizzardcon那样,直接在twitchtv上直播,可以在线
看,可以卖网络视频票,多高大上啊。
p*u
发帖数: 2454
p*****2
发帖数: 21240
32
来自主题: Programming版 - Cassandra 为啥干不过芒果?
小公司多 大部分应用scale都没有大到用cassandra
D**C
发帖数: 6754
33
来自主题: Programming版 - cassandra query speed求助
就十个column。
所以我觉得太慢了,我那个cassandra是公司提供的测试环境,我也不知道有多少人在
用。
你们有你们的一些metrics给我参考吗
i*****9
发帖数: 3157
34
来自主题: Programming版 - fb为啥没有坚持用Cassandra ?
因为Cassandra bug太多修不过来
p*****2
发帖数: 21240
35
来自主题: Programming版 - fb为啥没有坚持用Cassandra ?

cassandra?
z****e
发帖数: 54598
36
来自主题: DataSciences版 - Many 2 Many用cassandra怎么做好?
这是nosql你要怎样?
cassandra还是ap系统
真觉得relational db好,那就去用postgresql
f*****e
发帖数: 2992
37
来自主题: DataSciences版 - Many 2 Many用cassandra怎么做好?
用cassandra 2.09 + CQL 3.1怎么做pagination?
e********2
发帖数: 495
38
来自主题: DataSciences版 - Many 2 Many用cassandra怎么做好?
听说FB自己都不用cassandra了,是不是真的?
f*****e
发帖数: 2992
39
As paging is a big issue of Cassandra. I have a strategy to page using
secondary index: Add a column "page_number" corresponding to each column you
want to sort and page, create an index on the "page_number" column or just
use it as the clustering column. The "page_number" is a good candidate for
indexing, since it has low cardinality: every entry in the same page has the
same page number. If there are 100 entries in one page, then there are 100
entries with the same page number. Thus is low car... 阅读全帖
c***r
发帖数: 4631
40
土人俺本来在leisuretime版回了些帖,觉得可以总结起来,另外开一个贴了。发在这
儿。
http://www.mitbbs.com/article_t1/LeisureTime/1735253_0_1.html
*******分割线********
找点乐子借本帖积攒一下各个名字的来历?
我先贡献两个。
Hermione 这个名字来自古希腊神话,是斯巴达的公主,传说她妈海伦跟特洛伊的王子
Paris私奔了,他爹纠集了一帮英雄好汉渡海去围攻特洛伊,双方大战十年死伤无数,
最后放木马焚城……然后hermione她爹妈和好如初……好像跑题了。
Minerva这个名字来自罗马的知识,魔法,医药,商业和防御女神,和希腊的雅典娜是
一个神。如下图为美国国会图书馆的Minerva画像。
Minerva或者athena出现的时候会有一只“猫头鹰”,一根长矛,一个头盔,Aegis(包
括一个用蛇发女妖的头装饰的盾牌和(或)一个用蛇发女妖的头装饰的兽皮甲)和胜利女
神Nike。实际上Minerva这个名字一出现,结局就已经暴漏了。
土人俺来分析一下Harry Potter, Ron Weasley和... 阅读全帖
c***r
发帖数: 4631
41
哈利波特里面人名的一些历史痕迹
Harry Potter
Harry来自古代德语名字Haimric, Haim对应英语里Home,ric对应英语里的Reich和rich
,这个词是“一家之主,说话算数的人”的意思。Harry还有可能是来自维京人的名字
Harold,是“一军之主”的意思,反正也是“说话算数的人”。
当年维京人拿下了不列颠半壁江山,大致如下图。
除了给不列颠留下大量的维京人名字和地名外,这些维京人还烧毁了大量的古英语的文
字。导致我们现在说的英语用的是经济发达的伦敦地区的发音,写的英文用的是起源于
没被维京人占领的Wessex的拼写……
有个说法说Potter是一个诺曼底名字,当年来自诺曼底的征服者威廉姆征服英格兰的时
候手下有个姓Potter的人因为战功卓著而被封了一块地,从此英国有了Potter这个姓。
所以不出意外的话Harry Potter应该是诺曼底人后裔。
诺曼底人也是来自北欧的维京人。有一年维京海盗围攻巴黎,法国国王为了解围把不列
塔尼(Britannia)旁边的一片地皮给了维京人,被称为Normandy->north-man-dy。
Britannia的人... 阅读全帖
T*****n
发帖数: 2456
42
【 以下文字转载自 History 讨论区 】
发信人: cyfer (水管), 信区: History
标 题: 哈利波特里面人名的一些历史痕迹。
发信站: BBS 未名空间站 (Tue May 27 18:48:41 2014, 美东)
Harry Potter
Harry来自古代德语名字Haimric, Haim对应英语里Home,ric对应英语里的Reich和rich
,这个词是“一家之主,说话算数的人”的意思。Harry还有可能是来自维京人的名字
Harold,是“一军之主”的意思,反正也是“说话算数的人”。
有个说法说Potter是一个诺曼底名字,当年来自诺曼底的征服者威廉姆征服英格兰的时
候手下有个姓Potter的人因为战功卓著而被封了一块地,从此英国有了Potter这个姓。
所以不出意外的话Harry Potter应该是诺曼底人后裔。
Hermione Granger
Hermione 这个名字来自古希腊神话,是斯巴达的公主,传说她妈海伦跟特洛伊的王子
Paris私奔了,他爹纠集了一帮英雄好汉渡海去围攻特洛伊,双方大战十年死伤无数,
最后放木马焚城……然后hermio... 阅读全帖
c***r
发帖数: 4631
43
来自主题: LeisureTime版 - 哈利波特的魔法世界后面的故事
本帖把土人俺在xixi777的帖子《【西游】哈利。波特和他的魔法世界》后面外楼的回
帖总结一下另开一贴。
xixi777的帖子如下
http://www.mitbbs.com/article_t/LeisureTime/1735253.html
本帖基本和历史版的土人俺另外一个帖子保持同步。
http://www.mitbbs.com/article_t2/History/32033651.html
_____________________分割线_____________________.o0Ø0o.'Ö'
哈利波特里面人名的一些历史痕迹
Harry Potter
Harry来自古代德语名字Haimric, Haim对应英语里Home,ric对应英语里的Reich和rich
,这个词是“一家之主,说话算数的人”的意思。Harry还有可能是来自维京人的名字
Harold,是“一军之主”的意思,反正也是“说话算数的人”。
当年维京人拿下了不列颠半壁江山,大致如下图。
除了给不列颠留下大量的维京人名字和地名外,这些维京人还烧毁了大量的古英语的文
字。导致我们现在说的英语... 阅读全帖
c***r
发帖数: 4631
44
来自主题: LeisureTime版 - 哈利波特的魔法世界后面的故事
本帖把土人俺在xixi777的帖子《【西游】哈利。波特和他的魔法世界》后面外楼的回
帖总结一下另开一贴。
xixi777的帖子如下
http://www.mitbbs.com/article_t/LeisureTime/1735253.html
本帖基本和历史版的土人俺另外一个帖子保持同步。
http://www.mitbbs.com/article_t2/History/32033651.html
_____________________分割线_____________________.o0Ø0o.'Ö'
哈利波特里面人名的一些历史痕迹
Harry Potter
Harry来自古代德语名字Haimric, Haim对应英语里Home,ric对应英语里的Reich和rich
,这个词是“一家之主,说话算数的人”的意思。Harry还有可能是来自维京人的名字
Harold,是“一军之主”的意思,反正也是“说话算数的人”。
当年维京人拿下了不列颠半壁江山,大致如下图。
除了给不列颠留下大量的维京人名字和地名外,这些维京人还烧毁了大量的古英语的文
字。导致我们现在说的英语... 阅读全帖
c***r
发帖数: 4631
45
话说特洛伊国王Priam和王后Hecuba有个红头发女儿叫Cassandra。红头发这一条似乎支
持Hecuba是Thracian的说法。
Cassandra是太阳神阿波罗的祭祀。阿波罗有一次想诱惑Cassandra,就给了她预言的能
力。但是Cassandra拒绝和阿波罗oxox,阿波罗一气之下就诅咒Cassandra预言的东西没
有人相信。
这个世界上的悲剧莫过于此了。
Paris去希腊的时候,Cassandra就知道特洛伊会因此完蛋,但没有人信。Paris后来从
斯巴达弄回来一个叫海伦的美女,Cassandra愤怒地冲上去狂殴海伦,大家都觉得
Cassandra疯了。
后来Cassandra的哥哥Hector去大战Achilles的时候,Cassandra就知道Hector会死,尸
体还会被Achilles用战车拖着绕城三圈,但没有人信。悲剧啊!
后来Paris隔着城墙一箭射在Achilles的脚踵上,射死了Achilles。
后来希腊人留下一个木马,然后退兵,Cassandra知道木马里面是什么,拎着斧子和火
把要去毁了木马,但特洛伊人都以为她疯了,阻止了她。悲剧啊!
半夜里木... 阅读全帖
c***r
发帖数: 4631
46
话说特洛伊国王Priam和王后Hecuba有个红头发女儿叫Cassandra。红头发这一条似乎支
持Hecuba是Thracian的说法。
Cassandra是太阳神阿波罗的祭祀。阿波罗有一次想诱惑Cassandra,就给了她预言的能
力。但是Cassandra拒绝和阿波罗oxox,阿波罗一气之下就诅咒Cassandra预言的东西没
有人相信。
这个世界上的悲剧莫过于此了。
Paris去希腊的时候,Cassandra就知道特洛伊会因此完蛋,但没有人信。Paris后来从
斯巴达弄回来一个叫海伦的美女,Cassandra愤怒地冲上去狂殴海伦,大家都觉得
Cassandra疯了。
后来Cassandra的哥哥Hector去大战Achilles的时候,Cassandra就知道Hector会死,尸
体还会被Achilles用战车拖着绕城三圈,但没有人信。悲剧啊!
后来Paris隔着城墙一箭射在Achilles的脚踵上,射死了Achilles。
后来希腊人留下一个木马,然后退兵,Cassandra知道木马里面是什么,拎着斧子和火
把要去毁了木马,但特洛伊人都以为她疯了,阻止了她。悲剧啊!
半夜里木... 阅读全帖
T********i
发帖数: 2416
47
来自主题: Programming版 - goodbug短短6行代码7个常识错误
发信人: goodbug (好虫), 信区: Programming
标 题: Re: Goodbug这个人头重脚轻,嘴尖皮厚;不但学问浮夸,而且人品恶
发信站: BBS 未名空间站 (Mon Nov 25 16:02:11 2013, 美东)
就写这么个程序,随便你怎么优化,随便你用啥语言。在你那1万的机器上benchmark大
家看看,别光说不练。
int count = 100000;
for(int i = 0; i < 100000; i++){
int count = readCounter();
count--;
write(counter);
flush();
}
发信人: TeacherWei (TW), 信区: Programming
标 题: Re: Goodbug这个人头重脚轻,嘴尖皮厚;不但学问浮夸,而且人
发信站: BBS 未名空间站 (Mon Nov 25 16:08:41 2013, 美东)
就6行程序你还写错了。不明白fflush和fsync有啥差别是吧?
说呢基本功不扎实还真不是盖的。CS是体育老师教的吧?
发信人: ... 阅读全帖
T********i
发帖数: 2416
48
来自主题: Programming版 - 提上来:Goodbug有资格谈I/O么?
发信人: goodbug (好虫), 信区: Programming
标 题: Re: Goodbug这个人头重脚轻,嘴尖皮厚;不但学问浮夸,而且人品恶
发信站: BBS 未名空间站 (Mon Nov 25 16:02:11 2013, 美东)
看看GoogBug 6行程序犯了多少错误。
就写这么个程序,随便你怎么优化,随便你用啥语言。在你那1万的机器上benchmark大
家看看,别光说不练。
int count = 100000;
for(int i = 0; i < 100000; i++){
int count = readCounter();
count--;
write(counter);
flush();
}
发信人: TeacherWei (TW), 信区: Programming
标 题: Re: Goodbug这个人头重脚轻,嘴尖皮厚;不但学问浮夸,而且人
发信站: BBS 未名空间站 (Mon Nov 25 16:08:41 2013, 美东)
就6行程序你还写错了。不明白fflush和fsync有啥差别是吧?
说呢基本功不扎实还真... 阅读全帖
t*********e
发帖数: 630
49
来自主题: Java版 - 15 high-impact Apache projects
1. Cassandra
The Cassandra database serves as a "scalable system of record" in the big
data world, says Jonathan Ellis, vice president of the Cassandra project.
Apache received the project from Facebook, which open-sourced Cassandra in
2008. Whereas Hadoop undertakes data analysis, Cassandra provides a data
store for applications, often highly scalable ones on the Web. Netflix, for
example, runs many Cassandra clusters, Ellis says.
2. Cordova
Giving Apache prominence in mobile computing, Cordova... 阅读全帖
T********i
发帖数: 2416
50
一个大型系统必须有一个failover的完整方案。近日讨论中发现,网友在这个问题上多
存误解。而且很多错误认识竟然大行其道。
为再次避免谬种流传,不敢自匿,特公诸于众:
其实,这里面每一个事实,我都已经于多天前提到了。
Complete Failover Handbook
废话少说,failover方案一般2种
1. 同步写盘
2. 同步写网络(必须等ACK)
其他还有一些组合,比如异步写盘+同步写网络等等
现在看看同步写盘:
普通磁盘:
这个其实最复杂,为什么。因为我说过,磁头seek 5-8ms,转速4500-15000 RPM。
文件系统不好做就是要为磁盘做优化。因为磁盘的寻道seek太慢,因此尽量让文件水平
放置在磁道上。因为顺序读写sequential最普遍。磁盘转速太高sector扇区的编码还要
隔开。这样读完一个扇区OS发请求的间隔时间内,刚好转到下一个扇区。
同步写盘因为到达时间随机,基本上需要平均等半圈,这样平均按照15000 RPM算就是
15000 / 60 × 2 = 500次每秒。实际上数量应比这个低因为会seek。
当然如果sequential不间断同步写盘... 阅读全帖
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)