n*w 发帖数: 3393 | 1 我看到过说cassandra是schemaless的。但最近听了datastax的一个人明确地说
cassandra是有schema的,而且还 will keep it this way。
其他几个观点:
spark是今年来少有的让人激动的突破,cassandra加spark让所以其他,map reduce,
impala,
hadoop,
其他nosql,及其分别和spark或cassandra的组合都黯然失色,毫无竞争力。
cassandra几乎是唯一达到linear scaleout的。
、、、、 |
|
|
|
m*****n 发帖数: 2152 | 4 google了一下,下面回答对付面试,行不行?
1. hadoop 本质上有什么优势,比起传统的数据库?
大数据时代数据的特点是大量模糊数据(unstructured data)。Hadoop的优势是能对海
量模糊数据进行汇总排序比对等操作,把他们变成有意义的数据。传统的数据库擅长处
理精确数据(structured data),精确数据是指每条数据都有着准确的含义和确定的价
值,表达很明确的信息,但是无法做到短时间海量统计。
2. mongodb 本质上有什么优势?和sql比
传统有关系型数据库与NoSQL系统在数据结构上的本质区别。传统关系型数据库通常是
基于行的表格型存储,而NoSQL系统包括了列式存储(Cassandra)、key/value存储(
Memcached)、文档型存储(CouchDB)以及图结构存储(Neo4j)
mongodb的特点是非事务、schemaless、吞吐大,它们适用于 Web 2.0 应用用户广、数
据形式不固定、对事务无要求的特点。
3. TDD本质是怎么个过程?
Test-driven development (TDD) is a softwa... 阅读全帖 |
|
d********w 发帖数: 363 | 5 硅谷最火的高科技创业公司都有哪些?
在硅谷大家非常热情的谈创业谈机会,我也通过自己的一些观察和积累,看到了不少最
近几年涌现的热门创业公司。我给大家一个列表,这个是华尔街网站的全世界创业公司
融资规模评选(http://graphics.wsj.com/billion-dollar-club/)。它本来的标题是billion startup club,我在去年国内讲座也分享过,不到一年的时间,截至到2015年1月17日,现在的排名和规模已经发生了很大的变化。首先,估值在10Billlon的达到了7家,而一年前一家都没有。其次,第一名是中国人家喻户晓的小米,第三,前20名中,绝大多数(8成在美国,在加州,在硅谷,在旧金山!)比如Uber, Airbnb, Dropbox, Pinterest. 第四 里面也有不少相似模式成功的,比如Flipkart就是印度市场的淘宝,Uber与Airbnb都是共享经济的范畴。所以大家还是可以在移动(Uber),大数据(Palantir),消费级互联网,通讯(Snapchat),支付(Square),O2O App里面寻找下大机会。这里面很多公司我都亲自面... 阅读全帖 |
|
P*****f 发帖数: 2272 | 6 【 以下文字转载自 Programming 讨论区 】
发信人: Pontiff (树), 信区: Programming
标 题: 现在hibernate这种流行框架
发信站: BBS 未名空间站 (Fri Dec 16 01:15:56 2011, 美东)
是不是都用 annotaion, schemaless的POJO了,
总觉得在表达enity之间关系的时候比schema来得复杂,有没有好的review 文章? |
|
p*****2 发帖数: 21240 | 7
you
handle
you
多谢大牛。我们的数据是schemaless, 而且不需要join,所以上来就没考虑SQL。我昨
天做了一个试验,发现mongo的写基本上也是10K/sec。看来还不错。 |
|
P*****f 发帖数: 2272 | 8 是不是都用 annotaion, schemaless的POJO了,
总觉得在表达enity之间关系的时候比schema来得复杂,有没有好的review 文章? |
|
s*****n 发帖数: 5488 | 9 Foursquare uses MongoDB. So I would say performance is not an issue.
mongoDB的数据最后悔比mysql 大。可能又3倍以上。foursquare用两台70G的server就
搞定了。
用不用mongoDB还要看你们的需要。例如数据是不是schemaless.
比如timestamp, sensor, value, tag格式。
如果说value或者需求会经常变化,以location为例,
可以是gps location or wifi
一个是
lan/lat, accuracy,bearing, speed
一个只有ll+ accc
或者有将来扩展的需求,例如bluetooth location
或者是经常被tag,tag一些trace, debug info.
例如tag calling locID = {stream}
这样用mongoDB会很灵活。
否则的话,mysql很好用了。 |
|
c****e 发帖数: 1453 | 10 一个白马非马的问题也吵半天。什么狗屁service bus, 开个socket, 指哪打哪,
session自己管,性能爽歪歪。几把SOA,什么都是一个大string,你来我往,想用分号
就用分号,用逗号就用逗号,别笑,这叫schemaless. |
|
p*****2 发帖数: 21240 | 11
我也觉得数据量大了确实比较费机器。你觉得有什么好的选择?我觉得应该可以考虑
Redis做cache,postgres/mysql做persistence。因为其他NoSQL都没有Mongo这么强大
的query。当然主要看应用了。
Mongo的schemaless感觉还是比SQL要方便很多。用习惯了,想想SQL的alter table心里
就发怵。 |
|
p*****2 发帖数: 21240 | 12 其实Cassandra是没有schema的,但是有了CQL以后就有schema了。 |
|
|
A*****i 发帖数: 3587 | 14 曾经总改cassandra 的schema的飘过 |
|
c********1 发帖数: 421 | 15 schema , as in "database schema", or schemaless db
scheme, as in "Maven's versioning scheme...." |
|
g*****g 发帖数: 34805 | 16 小项目显然不如MySQL方便。Mongo的甜区其实比较狭窄。对MySQL的主要优势是
schemaless和对Json的支持,适合快糙猛。 |
|
e****t 发帖数: 17914 | 17 Schemaless MySQL 应该可以了
scratch? |
|
a*********y 发帖数: 63 | 18 Uber 官方的东西掩盖了很多事实. 要知道 Uber 以前就是用 MySql 的, 之后他们转成
Postgre, 现在又转回 MySql. 不仅如此, 现在他们用 schemaless. 感觉上从根本上
改变了很多东西.
如果不知道他们什么地方做错了, 那以后做类似 Uber 的东西就会犯同样的错误. |
|
m***r 发帖数: 680 | 19 现在的一些框架, 像 meteor做app, 或者parse server 服务器端的, 用的都是mongo,
但网上查了下, 好像mongo的名声不太好, 会出各种各样的问题, 初期数据不大时,
RMDB完全能够用, 而后期如果需要scale, mongo被骂的一踏糊涂, 也不合适.
另外postgresql也支持 schemaless的json 数据类型了, 所以不知大家有推荐的快速开
发框架, 对postgresql支持的比较好的么? 或者上述的2个框架, 有什么比较方便的能
连上postgre的. 多谢 |
|
c******n 发帖数: 16666 | 20 应该说我漏了个先决条件——第二次refactor
单纯就快肯定是monolith最快
但是我想到如果要考虑到将来搞CI,可能还是在第一次refactor时候就改micro
service(第一次弄的时候肯定是能跑就行,真用mongo上schemaless感觉也算合理),
就如你说的去耦合,扩展起来也是独立进行的,
好处是不用全部推翻重来,然后对CI比较友好,缺点无非就是最后overhead比较高,那
就堆硬件呗。。直到有钱有人了再一个一个service来refactor |
|