由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 坛子里有人搞HBase的吗?
相关主题
有什么好的cloud/bigdata 技术方面的会议?
相关话题的讨论汇总
话题: hbase话题: mysql话题: hadoop话题: cassandra话题: c++
进入Programming版参与讨论
1 (共1页)
p*****2
发帖数: 21240
1
感觉一水Cassandra。
f*******t
发帖数: 7549
2
我是搞HBase的……
p*****w
发帖数: 429
3
你们公司用了之后什么感觉?

【在 f*******t 的大作中提到】
: 我是搞HBase的……
f*******t
发帖数: 7549
4
我们是自己的fork,已经跟开源社区的分枝有很大差别了。现在use case越来越多,挺
好的

★ 发自iPhone App: ChineseWeb 8.6

【在 p*****w 的大作中提到】
: 你们公司用了之后什么感觉?
p*****w
发帖数: 429
5
i see.我听说维护麻烦,而且replica多.

【在 f*******t 的大作中提到】
: 我们是自己的fork,已经跟开源社区的分枝有很大差别了。现在use case越来越多,挺
: 好的
:
: ★ 发自iPhone App: ChineseWeb 8.6

f*******t
发帖数: 7549
6
维护是麻烦。replica多是指?

★ 发自iPhone App: ChineseWeb 8.6

【在 p*****w 的大作中提到】
: i see.我听说维护麻烦,而且replica多.
p*****w
发帖数: 429
7
我不知道hbase里面叫什么,就是mysql里面要有slaves. 你们一份数据有多少复制?假设
你们肯定也是网站应用.

【在 f*******t 的大作中提到】
: 维护是麻烦。replica多是指?
:
: ★ 发自iPhone App: ChineseWeb 8.6

p*****2
发帖数: 21240
8

膜拜大神。等我有问题再来问你。另外大神有比较过cassandra吗?

【在 f*******t 的大作中提到】
: 我是搞HBase的……
f*******t
发帖数: 7549
9
我们有三种replication:
1.异步replay log的slave
2.client同时写两个hbase,只从其中一个读取,对data loss和availability要求不高
3.quorum multi data center synchronous replication,快要发布了

★ 发自iPhone App: ChineseWeb 8.6

【在 p*****w 的大作中提到】
: 我不知道hbase里面叫什么,就是mysql里面要有slaves. 你们一份数据有多少复制?假设
: 你们肯定也是网站应用.

f*******t
发帖数: 7549
10
没有,我进公司之前Cassandra已经被抛弃了

★ 发自iPhone App: ChineseWeb 8.6

【在 p*****2 的大作中提到】
:
: 膜拜大神。等我有问题再来问你。另外大神有比较过cassandra吗?

相关主题
有什么好的cloud/bigdata 技术方面的会议?
进入Programming版参与讨论
g*****g
发帖数: 34805
11
Quancast?

【在 f*******t 的大作中提到】
: 我们有三种replication:
: 1.异步replay log的slave
: 2.client同时写两个hbase,只从其中一个读取,对data loss和availability要求不高
: 3.quorum multi data center synchronous replication,快要发布了
:
: ★ 发自iPhone App: ChineseWeb 8.6

f*******t
发帖数: 7549
12
你说我的公司?fb

★ 发自iPhone App: ChineseWeb 8.6

【在 g*****g 的大作中提到】
: Quancast?
p*****w
发帖数: 429
13
messenger?

【在 f*******t 的大作中提到】
: 你说我的公司?fb
:
: ★ 发自iPhone App: ChineseWeb 8.6

w**z
发帖数: 8232
14
去年HBasecon 一个中国小伙代表fb做keynotes, 很不错。

【在 f*******t 的大作中提到】
: 你说我的公司?fb
:
: ★ 发自iPhone App: ChineseWeb 8.6

c******3
发帖数: 296
15
为什么抛弃C*?有什么技术上的考量吗?

【在 f*******t 的大作中提到】
: 没有,我进公司之前Cassandra已经被抛弃了
:
: ★ 发自iPhone App: ChineseWeb 8.6

f*******t
发帖数: 7549
16
那是我们tech lead,挺牛的

【在 w**z 的大作中提到】
: 去年HBasecon 一个中国小伙代表fb做keynotes, 很不错。
f*******t
发帖数: 7549
17
具体细节我不清楚,至少eventually consistent model不能满足客户需求,尤其是
messaging这种对短时间内的data loss和disorder非常敏感的应用。

【在 c******3 的大作中提到】
: 为什么抛弃C*?有什么技术上的考量吗?
w**z
发帖数: 8232
18
方便透露,你们的newsfeed 存哪里的?

【在 f*******t 的大作中提到】
: 具体细节我不清楚,至少eventually consistent model不能满足客户需求,尤其是
: messaging这种对短时间内的data loss和disorder非常敏感的应用。

w**z
发帖数: 8232
19
从来没有明确说过原因。

【在 c******3 的大作中提到】
: 为什么抛弃C*?有什么技术上的考量吗?
f*******t
发帖数: 7549
20
他们本身有一个KV store,现在开始转向跟G丢出来的rocksdb(原名levelDB),C++派
大概不愿意用HBase

【在 w**z 的大作中提到】
: 方便透露,你们的newsfeed 存哪里的?
相关主题
有什么好的cloud/bigdata 技术方面的会议?
进入Programming版参与讨论
d*******r
发帖数: 3299
21
维护主要是哪点麻烦

【在 p*****w 的大作中提到】
: i see.我听说维护麻烦,而且replica多.
w**z
发帖数: 8232
22
那部分是用C++的? 我们用C*存newsfeed。

【在 f*******t 的大作中提到】
: 他们本身有一个KV store,现在开始转向跟G丢出来的rocksdb(原名levelDB),C++派
: 大概不愿意用HBase

p*****2
发帖数: 21240
23
靠。HBase快把我搞死了。怪不得三驾马车里排行末位呢。一晚上没整work。
f*******t
发帖数: 7549
24
前端PHP,后端C++的经典搭配嘛

【在 w**z 的大作中提到】
: 那部分是用C++的? 我们用C*存newsfeed。
z*******3
发帖数: 13709
25
主要是hadoop用了hbase吧
一开始fb用mysql,然后自己发明了c*,最后发现周围公司都在hadoop
于是就换到hbase去了
把c*贡献给了apache,apache把c*改造成了一个ap system
就非常适合搞缓存这种了,如果cp system,当然上来就是hbase了
这也没啥好考虑的

【在 c******3 的大作中提到】
: 为什么抛弃C*?有什么技术上的考量吗?
z*******3
发帖数: 13709
26
正常,哈哈
这是trade off
让你用couchbase的话,估计你不爽在后面
hbase好歹免费的文档多

【在 p*****2 的大作中提到】
: 靠。HBase快把我搞死了。怪不得三驾马车里排行末位呢。一晚上没整work。
p*****2
发帖数: 21240
27
感觉一水Cassandra。
f*******t
发帖数: 7549
28
我是搞HBase的……
p*****w
发帖数: 429
29
你们公司用了之后什么感觉?

【在 f*******t 的大作中提到】
: 我是搞HBase的……
f*******t
发帖数: 7549
30
我们是自己的fork,已经跟开源社区的分枝有很大差别了。现在use case越来越多,挺
好的

★ 发自iPhone App: ChineseWeb 8.6

【在 p*****w 的大作中提到】
: 你们公司用了之后什么感觉?
相关主题
有什么好的cloud/bigdata 技术方面的会议?
进入Programming版参与讨论
p*****w
发帖数: 429
31
i see.我听说维护麻烦,而且replica多.

【在 f*******t 的大作中提到】
: 我们是自己的fork,已经跟开源社区的分枝有很大差别了。现在use case越来越多,挺
: 好的
:
: ★ 发自iPhone App: ChineseWeb 8.6

f*******t
发帖数: 7549
32
维护是麻烦。replica多是指?

★ 发自iPhone App: ChineseWeb 8.6

【在 p*****w 的大作中提到】
: i see.我听说维护麻烦,而且replica多.
p*****w
发帖数: 429
33
我不知道hbase里面叫什么,就是mysql里面要有slaves. 你们一份数据有多少复制?假设
你们肯定也是网站应用.

【在 f*******t 的大作中提到】
: 维护是麻烦。replica多是指?
:
: ★ 发自iPhone App: ChineseWeb 8.6

p*****2
发帖数: 21240
34

膜拜大神。等我有问题再来问你。另外大神有比较过cassandra吗?

【在 f*******t 的大作中提到】
: 我是搞HBase的……
f*******t
发帖数: 7549
35
我们有三种replication:
1.异步replay log的slave
2.client同时写两个hbase,只从其中一个读取,对data loss和availability要求不高
3.quorum multi data center synchronous replication,快要发布了

★ 发自iPhone App: ChineseWeb 8.6

【在 p*****w 的大作中提到】
: 我不知道hbase里面叫什么,就是mysql里面要有slaves. 你们一份数据有多少复制?假设
: 你们肯定也是网站应用.

f*******t
发帖数: 7549
36
没有,我进公司之前Cassandra已经被抛弃了

★ 发自iPhone App: ChineseWeb 8.6

【在 p*****2 的大作中提到】
:
: 膜拜大神。等我有问题再来问你。另外大神有比较过cassandra吗?

g*****g
发帖数: 34805
37
Quancast?

【在 f*******t 的大作中提到】
: 我们有三种replication:
: 1.异步replay log的slave
: 2.client同时写两个hbase,只从其中一个读取,对data loss和availability要求不高
: 3.quorum multi data center synchronous replication,快要发布了
:
: ★ 发自iPhone App: ChineseWeb 8.6

f*******t
发帖数: 7549
38
你说我的公司?fb

★ 发自iPhone App: ChineseWeb 8.6

【在 g*****g 的大作中提到】
: Quancast?
p*****w
发帖数: 429
39
messenger?

【在 f*******t 的大作中提到】
: 你说我的公司?fb
:
: ★ 发自iPhone App: ChineseWeb 8.6

w**z
发帖数: 8232
40
去年HBasecon 一个中国小伙代表fb做keynotes, 很不错。

【在 f*******t 的大作中提到】
: 你说我的公司?fb
:
: ★ 发自iPhone App: ChineseWeb 8.6

相关主题
有什么好的cloud/bigdata 技术方面的会议?
进入Programming版参与讨论
c******3
发帖数: 296
41
为什么抛弃C*?有什么技术上的考量吗?

【在 f*******t 的大作中提到】
: 没有,我进公司之前Cassandra已经被抛弃了
:
: ★ 发自iPhone App: ChineseWeb 8.6

f*******t
发帖数: 7549
42
那是我们tech lead,挺牛的

【在 w**z 的大作中提到】
: 去年HBasecon 一个中国小伙代表fb做keynotes, 很不错。
f*******t
发帖数: 7549
43
具体细节我不清楚,至少eventually consistent model不能满足客户需求,尤其是
messaging这种对短时间内的data loss和disorder非常敏感的应用。

【在 c******3 的大作中提到】
: 为什么抛弃C*?有什么技术上的考量吗?
w**z
发帖数: 8232
44
方便透露,你们的newsfeed 存哪里的?

【在 f*******t 的大作中提到】
: 具体细节我不清楚,至少eventually consistent model不能满足客户需求,尤其是
: messaging这种对短时间内的data loss和disorder非常敏感的应用。

w**z
发帖数: 8232
45
从来没有明确说过原因。

【在 c******3 的大作中提到】
: 为什么抛弃C*?有什么技术上的考量吗?
f*******t
发帖数: 7549
46
他们本身有一个KV store,现在开始转向跟G丢出来的rocksdb(原名levelDB),C++派
大概不愿意用HBase

【在 w**z 的大作中提到】
: 方便透露,你们的newsfeed 存哪里的?
d*******r
发帖数: 3299
47
维护主要是哪点麻烦

【在 p*****w 的大作中提到】
: i see.我听说维护麻烦,而且replica多.
w**z
发帖数: 8232
48
那部分是用C++的? 我们用C*存newsfeed。

【在 f*******t 的大作中提到】
: 他们本身有一个KV store,现在开始转向跟G丢出来的rocksdb(原名levelDB),C++派
: 大概不愿意用HBase

p*****2
发帖数: 21240
49
靠。HBase快把我搞死了。怪不得三驾马车里排行末位呢。一晚上没整work。
f*******t
发帖数: 7549
50
前端PHP,后端C++的经典搭配嘛

【在 w**z 的大作中提到】
: 那部分是用C++的? 我们用C*存newsfeed。
相关主题
有什么好的cloud/bigdata 技术方面的会议?
进入Programming版参与讨论
z*******3
发帖数: 13709
51
主要是hadoop用了hbase吧
一开始fb用mysql,然后自己发明了c*,最后发现周围公司都在hadoop
于是就换到hbase去了
把c*贡献给了apache,apache把c*改造成了一个ap system
就非常适合搞缓存这种了,如果cp system,当然上来就是hbase了
这也没啥好考虑的

【在 c******3 的大作中提到】
: 为什么抛弃C*?有什么技术上的考量吗?
z*******3
发帖数: 13709
52
正常,哈哈
这是trade off
让你用couchbase的话,估计你不爽在后面
hbase好歹免费的文档多

【在 p*****2 的大作中提到】
: 靠。HBase快把我搞死了。怪不得三驾马车里排行末位呢。一晚上没整work。
z*******3
发帖数: 13709
53
不过不对啊
你们不是早就hadoop了么?
hadoop难道不是用hbase做persistence?
c*大多数时候我们是用来存一些非重要性数据
比如log这些,当典型的nosql用
主要目的是读写快,反正牺牲掉了短期的consistent
hbase更多的是一种db的替代
就是没有transaction就是了
只要你不update历史数据,都没啥问题
z*******3
发帖数: 13709
54
我一直都认为c*和mongodb这些,不是一个层面的,跟hbase
hbase是非用不可,除非你不用hadoop
但是在这个之前,有无数种方式予以优化,c*只是其中一种
这个内森那篇文章介绍storm时候说得很好啊
他用了三个persistence
分别是c*,hbase和他自己写的elephonedb
其实把这里elephonedb换成postgresql也一样用
你们才用一个数据库或者nosql的产品吗?
我现在就用了三个了,hbase虽然也用,但是主要时间不是在hbase上
而是在c*这些更靠近前端的缓冲库上,还有db

【在 p*****2 的大作中提到】
: 靠。HBase快把我搞死了。怪不得三驾马车里排行末位呢。一晚上没整work。
p*****2
发帖数: 21240
55
hadoop可以用hdfs吧

【在 z*******3 的大作中提到】
: 不过不对啊
: 你们不是早就hadoop了么?
: hadoop难道不是用hbase做persistence?
: c*大多数时候我们是用来存一些非重要性数据
: 比如log这些,当典型的nosql用
: 主要目的是读写快,反正牺牲掉了短期的consistent
: hbase更多的是一种db的替代
: 就是没有transaction就是了
: 只要你不update历史数据,都没啥问题

p*****2
发帖数: 21240
56
我们主要Redis mongo

【在 z*******3 的大作中提到】
: 我一直都认为c*和mongodb这些,不是一个层面的,跟hbase
: hbase是非用不可,除非你不用hadoop
: 但是在这个之前,有无数种方式予以优化,c*只是其中一种
: 这个内森那篇文章介绍storm时候说得很好啊
: 他用了三个persistence
: 分别是c*,hbase和他自己写的elephonedb
: 其实把这里elephonedb换成postgresql也一样用
: 你们才用一个数据库或者nosql的产品吗?
: 我现在就用了三个了,hbase虽然也用,但是主要时间不是在hbase上
: 而是在c*这些更靠近前端的缓冲库上,还有db

p*****2
发帖数: 21240
57
好虫不是说c也可以cp吗

【在 z*******3 的大作中提到】
: 主要是hadoop用了hbase吧
: 一开始fb用mysql,然后自己发明了c*,最后发现周围公司都在hadoop
: 于是就换到hbase去了
: 把c*贡献给了apache,apache把c*改造成了一个ap system
: 就非常适合搞缓存这种了,如果cp system,当然上来就是hbase了
: 这也没啥好考虑的

p*****2
发帖数: 21240
58
貌似需要重启zookeeper 这个看来稳定性有点问题呀

【在 z*******3 的大作中提到】
: 正常,哈哈
: 这是trade off
: 让你用couchbase的话,估计你不爽在后面
: hbase好歹免费的文档多

H****S
发帖数: 1359
59
不喜欢用,.meta table如果被戳了几个洞处理起来很麻烦。

【在 p*****2 的大作中提到】
: 感觉一水Cassandra。
d*******r
发帖数: 3299
60
hadoop 有这么必须? 只能处理 offline batch job, 学起来还麻烦,现在还在转 2.0,
看着有点晕呢

【在 z*******3 的大作中提到】
: 我一直都认为c*和mongodb这些,不是一个层面的,跟hbase
: hbase是非用不可,除非你不用hadoop
: 但是在这个之前,有无数种方式予以优化,c*只是其中一种
: 这个内森那篇文章介绍storm时候说得很好啊
: 他用了三个persistence
: 分别是c*,hbase和他自己写的elephonedb
: 其实把这里elephonedb换成postgresql也一样用
: 你们才用一个数据库或者nosql的产品吗?
: 我现在就用了三个了,hbase虽然也用,但是主要时间不是在hbase上
: 而是在c*这些更靠近前端的缓冲库上,还有db

相关主题
有什么好的cloud/bigdata 技术方面的会议?
进入Programming版参与讨论
z****e
发帖数: 54598
61
要tune
麻烦
懒得做
而且各种features少很多
我们弄个cache不就是图方便么?
mongodb最大的卖点也是简单,容易上手,像db
要不然谁用它?

【在 p*****2 的大作中提到】
: 好虫不是说c也可以cp吗
z****e
发帖数: 54598
62
是没这么必需,但是现在不都在big data么?
是个人就上hadoop,现在差不多是时候让它破了
规模没有到的,不上也罢
但是对于到了这个规模的,其实这后面是另外一套系统
跟前台作页面的不在一个层面上
到时候估计都是另外一个组在做
如果这个层面跟前台是同一批人在做的话
那就说明这个其实是滥用,前台程序员还是专心做点js比较好
前台用hadoop有些扯淡

0,

【在 d*******r 的大作中提到】
: hadoop 有这么必须? 只能处理 offline batch job, 学起来还麻烦,现在还在转 2.0,
: 看着有点晕呢

d*******r
发帖数: 3299
63
每次看到hadoop2.0那个构架图,我就觉得它想做的事情太多了...
http://hortonworks.com/hadoop/yarn/

【在 z****e 的大作中提到】
: 是没这么必需,但是现在不都在big data么?
: 是个人就上hadoop,现在差不多是时候让它破了
: 规模没有到的,不上也罢
: 但是对于到了这个规模的,其实这后面是另外一套系统
: 跟前台作页面的不在一个层面上
: 到时候估计都是另外一个组在做
: 如果这个层面跟前台是同一批人在做的话
: 那就说明这个其实是滥用,前台程序员还是专心做点js比较好
: 前台用hadoop有些扯淡
:

z****e
发帖数: 54598
64
他们考虑的至少是至少上千一般上万台机器的处理
不是有牛人介绍过yarn么?
说目前除了yahoo,其他公司恐怕都达不到这个规模
你们公司有cdo这个职位么?
http://en.wikipedia.org/wiki/Chief_data_officer
如果有的话,用这个差不多
否则就有些overkill了
我不是很喜欢这种搞法,太重了,就像以前ejb一样
什么情况都按照最复杂的情况来处理,简单的反而更容易搞定市场
所以cassandra很好啊,对付大多数网站其实足够了,配合一个简单的db
比如postgresql,可以了

【在 d*******r 的大作中提到】
: 每次看到hadoop2.0那个构架图,我就觉得它想做的事情太多了...
: http://hortonworks.com/hadoop/yarn/

z****e
发帖数: 54598
65
可以阿,但是纯文件搞起来也有些低效率
当然还是优先考虑堆轮子了
hdfs上也没有其他数据库可以用了

【在 p*****2 的大作中提到】
: hadoop可以用hdfs吧
z****e
发帖数: 54598
66
http://www.mitbbs.com/article_t/Java/31140605.html

【在 d*******r 的大作中提到】
: 每次看到hadoop2.0那个构架图,我就觉得它想做的事情太多了...
: http://hortonworks.com/hadoop/yarn/

z****e
发帖数: 54598
67
过了一段时间回头看这个图
发现yarn上连hpc的mpi接口都有阿
啧啧,高大上,高大上

【在 d*******r 的大作中提到】
: 每次看到hadoop2.0那个构架图,我就觉得它想做的事情太多了...
: http://hortonworks.com/hadoop/yarn/

d*******r
发帖数: 3299
68
看完后更坚定了不花时间学习hadoop2.0的决定...
我等屌丝projects肯定用不上了,自己也不喜欢这么复杂的东西

【在 z****e 的大作中提到】
: http://www.mitbbs.com/article_t/Java/31140605.html
z****e
发帖数: 54598
69
然,这个等进了yahoo之类再学不迟
大多数人真用不到这么复杂的东西

【在 d*******r 的大作中提到】
: 看完后更坚定了不花时间学习hadoop2.0的决定...
: 我等屌丝projects肯定用不上了,自己也不喜欢这么复杂的东西

d*******r
发帖数: 3299
70
我有同学就在yahoo里面写这个,我听他说也是一头雾水,估计他也是个螺丝钉而已

【在 z****e 的大作中提到】
: 然,这个等进了yahoo之类再学不迟
: 大多数人真用不到这么复杂的东西

相关主题
有什么好的cloud/bigdata 技术方面的会议?
进入Programming版参与讨论
z****e
发帖数: 54598
71
正常,正常
大多数人都是瞎子摸象
世界这么大,没有人能知道全部东西
立足本行,然后渗透周边知识点,能做到这点已经很牛逼了
只有五年硕士这种,才会大言不惭说自己什么都懂
其实什么都不懂

【在 d*******r 的大作中提到】
: 我有同学就在yahoo里面写这个,我听他说也是一头雾水,估计他也是个螺丝钉而已
t***t
发帖数: 6066
72
is big data a hype?
2 weeks ago, visited a start up, they are just using mysql. they said unless
you are yahoo or google, you can just use mysql for everything.
w**z
发帖数: 8232
73
道理是这样的。就像那么多startup 都是用php。time to market 是最重要的。mysql
还是懂的人多,没有learning curve。 但随着nosql 的普及,会的人多了,就会有小
公司开始用了。如果我现在换工作,去一个小公司,凭我对C*的熟悉,我就会在合适
的情况下上。

unless

【在 t***t 的大作中提到】
: is big data a hype?
: 2 weeks ago, visited a start up, they are just using mysql. they said unless
: you are yahoo or google, you can just use mysql for everything.

d*******r
发帖数: 3299
74
postgresql 还是远远不如 mysql?
感觉从 postgresql 转 mysql 也不难呀

mysql

【在 w**z 的大作中提到】
: 道理是这样的。就像那么多startup 都是用php。time to market 是最重要的。mysql
: 还是懂的人多,没有learning curve。 但随着nosql 的普及,会的人多了,就会有小
: 公司开始用了。如果我现在换工作,去一个小公司,凭我对C*的熟悉,我就会在合适
: 的情况下上。
:
: unless

g*****g
发帖数: 34805
75
startup can have 400 users, or 400 million users, the technology chosen is
dependent on the scale.

mysql

【在 w**z 的大作中提到】
: 道理是这样的。就像那么多startup 都是用php。time to market 是最重要的。mysql
: 还是懂的人多,没有learning curve。 但随着nosql 的普及,会的人多了,就会有小
: 公司开始用了。如果我现在换工作,去一个小公司,凭我对C*的熟悉,我就会在合适
: 的情况下上。
:
: unless

t***t
发帖数: 6066
76
应该差不多吧?都是传统db。
没用过postgresql。mysql被oracle给慢性自杀了,十年基本没有development。

【在 d*******r 的大作中提到】
: postgresql 还是远远不如 mysql?
: 感觉从 postgresql 转 mysql 也不难呀
:
: mysql

z****e
发帖数: 54598
77
主要是很多用户有惯性
所以都还在mysql
我在sun被收购那天起就不用mysql了
坚决postgresql
which is written in pure c
good one

【在 t***t 的大作中提到】
: 应该差不多吧?都是传统db。
: 没用过postgresql。mysql被oracle给慢性自杀了,十年基本没有development。

1 (共1页)
进入Programming版参与讨论
相关主题
有什么好的cloud/bigdata 技术方面的会议?
相关话题的讨论汇总
话题: hbase话题: mysql话题: hadoop话题: cassandra话题: c++