由买买提看人间百态

topics

全部话题 - 话题: cassandra
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
w****a
发帖数: 710
1
来自主题: JobHunting版 - U/A/Z去哪家?(面经随后更新)
这两天收到打车app,租房app,某all in one hr平台的口头offer,package细节下周
能出来,这周末提前好好考虑下。
另外手里还有个fb的offer保底。
板上大牛们帮分析下,现在去哪家还能有点汤喝?
---
10/28 update
准备卖身去打车公司当司机了,要去的组我非常喜欢,感觉能学到很多东西。
其实租房网也很不错,我其实纠结了很久。他们家去了之后基本可以随便去喜欢的组,
做喜欢的事情,这点很给力。至于车间的装修多么的好,我就不用说了,大家随便搜搜
图片就可以看出来。
但是综合来看,最后还是选择去当司机。主要是以下几点原因:
1. 要去的组业务多,公司貌似很重视。我觉得很能锻炼人,这个对new grads来说比什
么都重要。
2. 要去的组同胞多,甚至基本都是同胞。我觉得在美国,真正最后能帮上忙称之为人
脉的,永远只能是同胞。
3. 未来的manager是标准的德艺双馨,我打听了很多人,都说口碑很好。我觉得找工作
跟找phd有些许相似的地方,公司本身未必那么的重要,去哪个组以及你的老板怎么样
,有时候能直接决定你的career path。
4. Packa... 阅读全帖
w**z
发帖数: 8232
2
来自主题: JobHunting版 - 请问最热的nosql是哪个?
redis 是cache。 mongodb Cassandra ,一个 document store, 一个 column family.
看你的 use case.
hbase, Cassandra 的话,现在看 Cassandra 用的更多,前景更好。
h*******0
发帖数: 270
3
来自主题: JobHunting版 - 请问最热的nosql是哪个?
相对来说,cassandra比较好。 mongo 是master-slave的形式,master down你就比较
麻烦。 cassandra任意down掉都没问题。 cassandra是eventual consistency。 所以
可能出现短暂时间,插入的数据查不到,如果node多的话,ms的级别吧。

发帖数: 1
4
来自主题: JobHunting版 - 内推苹果itunes部门
内推苹果的itunes部门,在cupertino.
技术方面,基本上是java,cassandra和kafka。 面试主要是算法加系统设计,刷题是
必要的。
工作经验最好有5年以上经验的,用过cassandra和kafka有加分。
感兴趣给我发邮件吧,我的邮件是:tommiemoore007 at gmail
具体要求见下:
Key Qualifications
8-10 years hands on engineering experience
Strong development skills in Scala and Java
A history of management and/or architect-level experience guiding teams to
success
Experience designing and building multi-datacenter distributed systems with
strong latency and SLA requirements.
Understands different data storage... 阅读全帖

发帖数: 1
5
资本寒冬
科技企业缩招
暑期实习招满在即
简历苍白的你机会在哪?
大数据行业蓬勃发展
1个小时
高级大数据工程师
为你全方位解读行业
带你终点冲刺
获取优质实习
1个小时,带你全方位解析Big Data行业环境、Big Data最新技术(Hadoop/Spark/
Storm/Kafka/Cassandra等)、硅谷一线公司大数据架构,助你明晰节奏、获取面试、
找到优质工作!
目标人群:
大数据爱好者,大数据工程初中级学者,对Big Data Engineer感兴趣的人群,希望找
到Big Data Engineer实习/全职的人群
讲座大纲:
【求职篇】
Big Data Engineer职位有多火(发展前景、薪资水平、市场需求)
Big Data Engineer实习怎么找(刷题、简历、时间节点)
Big Data Engineer实习做什么(职责、技能提升、Return Offer如何拿)
Big Data Engineer实习对于找全职的意义
3月底如何抓紧冲刺,找到优质实习
对正在这条道路上奋斗的朋友们的一些建议
【技术篇】
硅谷一线公司大数据架构(Big Data Infr... 阅读全帖

发帖数: 1
6
资本寒冬
科技企业缩招
暑期实习招满在即
简历苍白的你机会在哪?
大数据行业蓬勃发展
1个小时
高级大数据工程师
为你全方位解读行业
带你终点冲刺
获取优质实习
继前几年的疯狂扩招后,美国各大科技企业包括FLAG都在2017年紧急缩招,如何在美国
就业市场上,把握好求职时间节点,如何准备求职,如何提升背景,都变得极为关键。
随着大数据应用的爆发性增长,越来越多的公司开放Big Data Engineer的岗位。
1个小时,带你全方位解析Big Data行业环境、Big Data最新技术(Hadoop/Spark/
Storm/Kafka/Cassandra等)、硅谷一线公司大数据架构,助你明晰节奏、获取面试、
找到优质工作!
目标人群:
大数据爱好者,大数据工程初中级学者,对Big Data Engineer感兴趣的人群,希望找
到Big Data Engineer实习/全职的人群
讲座大纲:
【求职篇】
Big Data Engineer职位有多火(发展前景、薪资水平、市场需求)
Big Data Engineer实习怎么找(刷题、简历、时间节点)
Big Data Engineer... 阅读全帖
x*******6
发帖数: 262
7
package org.spring.cassandra.example;
import java.net.InetAddress;
import java.net.UnknownHostException;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import org.springframework.data.cassandra.core.CassandraOperations;
import org.springframework.data.cassandra.core.CassandraTemplate;
import com.datastax.driver.core.Cluster;
import com.datastax.driver.core.Session;
import com.datastax.driver.core.querybuilder.QueryBuilder;
import com.datastax.driver.core.querybuilder.Select;
public cla... 阅读全帖
c******n
发帖数: 4965
8
来自主题: Java版 - anyone familiar with JNA?
got an exception, can't figure out why it happened:
thanks a lot
INFO 17:48:12,321 Unable to link C library. Native methods will be disabled.
java.lang.UnsatisfiedLinkError: Error looking up function
'$$YJP$$mlockall': java: undefined symbol: $$YJP$$mlockall
at com.sun.jna.Function.(Function.java:179)
at com.sun.jna.NativeLibrary.getFunction(NativeLibrary.java:344)
at com.sun.jna.NativeLibrary.getFunction(NativeLibrary.java:324)
at com.sun.jna.Native.register(N... 阅读全帖
t*******e
发帖数: 684
9
来自主题: Java版 - BIgData对job market的影响?
我自己没实际比较过hbase cassandra。不过google一下最近的评价,很多从hbase转
cassandra的。
goodbug 在用cassandra,能不能给讲讲最不满意的地方。
t*******e
发帖数: 684
10
来自主题: Java版 - BIgData对job market的影响?
你正在做hbase, 自然是知道多。NN是SPOF,直到2012年间还是事实,变成是我乱说的
,不是update-to-date knowledge是另外一回事。理论上cassandra的确比hbase美好,
同意实际上可能不是一回事。
论坛本来就是让大家讨论的,没有人能保证自己什么都正确,包括你在内。建议你也把
基础打打好,先搞懂什么是ad hoc query。

cassandra
cassandra
g*****g
发帖数: 34805
11
来自主题: Java版 - 请教个ec2 + nosql 的问题
If your data is not very relational, EC2 + Cassandra is quite a safe bet.
Cassandra is a beast on write/read linear scalability. And you can certainly
unload your data in realtime. The major benefit is that you can easily
scale to a cluster of hundreds of nodes for you Cassandra cluster, if you
need that much high availability. Today, only the likes of Google, Facebook
cannot be hosted on EC2.
z****e
发帖数: 54598
12
来自主题: Java版 - OpenShift怎么上数据库?
自己做cassandra需要一个gear
free的可以跑,你要自己做
https://www.openshift.com/blogs/cassandra-on-openshift
cassandra是基于column的
文件系统的话,可能只有hdfs了
z****e
发帖数: 54598
13
来自主题: Java版 - OpenShift怎么上数据库?
自己做cassandra需要一个gear
free的可以跑,你要自己做
https://www.openshift.com/blogs/cassandra-on-openshift
cassandra是基于column的
文件系统的话,可能只有hdfs了
z****e
发帖数: 54598
14
来自主题: Java版 - Java 做网站
hadoop+spark+hbase/cassandra+vert.x/tomcat
vert.x文档比较少,你要比较懂java才行,对网络的协议要比较清晰才行
否则你黑暗中摸索会有很大的心理压力,而且很有可能会做不出来
多少算懂?,这个thread学ee转行的domini回了两个帖子
如果你能看懂他的帖子为什么错,你就算懂,他的两个回帖都是很似是而非的错误
如果你看不懂为什么错,那么还是先不要碰vert.x,用tomcat,至少网络上文档多
hbase和cassandra有apache官方文档
但是你要理解ap&cp系统的差异,但是总体而言比mongodb和couchdb要好用很多
spark和stanford nlp也比python的破pkg要快很多
openshift,jboss,vert.x,jruby这些都是red hat做的
所以互相之间的契合度会高一点
hadoop,spark,hbase,cassandra这几个都是apache的产品
所以互相之间的契合度也会高一点,就是有各种优化,跑得快一点
但是前提是你要懂才行
ide你就不要用jboss studio了,很难用
e... 阅读全帖
g*****g
发帖数: 34805
15
来自主题: Programming版 - server side language 统计,java:.Net = 1:5
RavenDB对应MongoDB说得过去,对应不了Cassandra。Cassandra是纯粹的P2P,没有
Master/Slave。这对于write intensive app诸如twitter很重要。
NoSQL DB有不同取舍,我不是简单的说哪个设计比哪个好。但在成名应用上RavenDB跟
Cassandra上不是一个量级的。


Dll.
c****e
发帖数: 1453
16
来自主题: Programming版 - Python就是爽
"mongodb的缺点很明显,就是要把所有的索引全部读入内存"
不能全部放入内存也可以。会swap out。如果是顺序处理,对性能影响不大。
"这两个在nosql领域把c++写的mongodb干得死去活来"
MongoDB没有比Cassandra先行,现在社区比Cassandra还活跃。NoSQL的发展正在和SQL
融合,原来视为原罪的transaction也在找回自己的位置,特别是in-memory越来越流行
了。 Cassandra攻下noSQL,Java原教旨主义都不敢这么说。 即使Hadoop, 对于大数据
处理,也是一个方面的工具。MPP和Mapreduce都有自己的位置。
z*******3
发帖数: 13709
17
来自主题: Programming版 - Python就是爽
大神您说对了,这些我都还在观望阶段
只有maven真正用了上去
这几个还在讨论阶段,也就是hadoop接近快上马了
因为2.0快出来了
其它两个,还处于观望阶段
另外,hbase之前把cassandra干得够呛
因为跟hadoop之间的协作要明显优于cassandra
迫使cassandra转向,去跟hadoop做整合
这样才逐步回春
大神我还是追问您,python到底有什么产品
别回避这个最简单最原始的问题
您看别人都帮你举了不少例子出来
倒是您有些不着调,跑去扯linux,这样不好
c****e
发帖数: 1453
18
来自主题: Programming版 - Python就是爽
"mongodb的缺点很明显,就是要把所有的索引全部读入内存"
不能全部放入内存也可以。会swap out。如果是顺序处理,对性能影响不大。
"这两个在nosql领域把c++写的mongodb干得死去活来"
MongoDB没有比Cassandra先行,现在社区比Cassandra还活跃。NoSQL的发展正在和SQL
融合,原来视为原罪的transaction也在找回自己的位置,特别是in-memory越来越流行
了。 Cassandra攻下noSQL,Java原教旨主义都不敢这么说。 即使Hadoop, 对于大数据
处理,也是一个方面的工具。MPP和Mapreduce都有自己的位置。
z*******3
发帖数: 13709
19
来自主题: Programming版 - Python就是爽
大神您说对了,这些我都还在观望阶段
只有maven真正用了上去
这几个还在讨论阶段,也就是hadoop接近快上马了
因为2.0快出来了
其它两个,还处于观望阶段
另外,hbase之前把cassandra干得够呛
因为跟hadoop之间的协作要明显优于cassandra
迫使cassandra转向,去跟hadoop做整合
这样才逐步回春
大神我还是追问您,python到底有什么产品
别回避这个最简单最原始的问题
您看别人都帮你举了不少例子出来
倒是您有些不着调,跑去扯linux,这样不好
w**z
发帖数: 8232
20
if it has concurrent writes with high volume, Cassandra is better, the write
is sequential disk write, extremely fast (<1ms). For Mongo, need to read
before write since it's a Bson on disk.
You can use Hadoop integration with Cassandra to read data out. But don't
expect much for relational flavor of sql from Cassandra. Think of it as a
big Hashtable, no join, very poor index support. It's good at HA and large
volume writes.
w**z
发帖数: 8232
21
Sure, Cassandra's read is fast also, but it might involve multiple disk
accesses based on the number of SSTables it needs to read from. So for us it
's the average is 10ms vs 1ms :)
Do you have any experience with HBase? From the benchmark, it's even better
than Cassandra, but it's a lot more complicated to manage.
By the way, there is Cassandra Summit next week in SF and Hbase conference
the day after. I am going to both of them. Are you going by any chance?
z****e
发帖数: 54598
22
来自主题: Programming版 - persistence的选择
主要缺陷就是跟hadoop本身的协作上
后来cassandra也作为hadoop的一个相关项目存在后
hbase的优势被削弱了,而且cassandra更容易拆分开来,单独用
hbase作为一个独立的个体的话,其价值相对有限
感觉很少有人这样用,而且现在版本号上说
cassandra两周前总算是上2.0了,可以用了
hbase还不知道waterloo那帮人要搞到什么时候去
g*****g
发帖数: 34805
23
来自主题: Programming版 - 好虫,看看你的东东有没有问题?
魏老师不就是这样吗?他吹了半天的所谓核心log db系统,cassandra已经实现了,还
带cluster 支持。
他用c++写一个,latency可能能低一些,throughput肯定是被cassandra cluster秒的
。我要他那个东西干啥。
所以到头来没办法了,就只好拍胸脯我写一个能秒cassandra, 反正吹牛不上税。
T********i
发帖数: 2416
24
goodbug和zhaoce都是输不起的。而且辩论的品格非常不好。本来不打算回应就算了。
之所以回应就是因为害怕谬种流传。很多不明真相的网友把谬误当作真理。当然也包括
这两位。
goodbug号称用cassandra方案解决我提出的春运售票问题。在我提出我的方案
performance的throughput比他的高1-2个数量级的情况下。他认为他的方案可靠性比我
的好。理由是能够同步写log到磁盘。在我提出用磁盘(磁盘是机械式的,SSD不是磁盘
,是基于半导体的)同步写每秒不到千的情况下,他给我一个链接和一张图。号称【
quote】写一个结点能到1000,写100个就可以接近10万。【quote】
我只能这种人的基本功连做一个普通程序员都不见得够格。如何能有人追捧他?看来公
共论坛水的嗓门大貌似水有理。
简单说一下:
1. 操作系统下普通的文件写操作一般是写到缓冲区,然后由OS schedule磁盘的写操作
。要强制flush缓冲区需要特殊API fsync。这个过程很费时,而且是blocking的。因为
普通磁盘的寻道时间都在5ms以上。IOPS(IO per second)不会很高... 阅读全帖
g*****g
发帖数: 34805
25
你怎么这么弱智呀。订单的数目远远大于票数。订单写到Cassandra里。处理订单的模块
又不是在线处理的,Cassandra每秒写10万订单,处理订单的模块不需要处理每秒10万
订单。
传统数据库最多最多也不过要写票的数目罢了,让你1000条线* 1万张票,一天也不过
1000万
次写。这1千万次写是由订单处理模块触发的,速度完全可控。票卖没了,后面的订单
,自然直接
杀掉,回写Cassandra DB标志位也好,发email通知也好,不会碰到传统数据库
且不提种种数据划分都可以降低每个独立系统需要处理的订单数目,远不如1千万张。
尼玛一个东西,说了这么多次都不上道,理解能力太低了吧。

至少
就是
f****4
发帖数: 1359
26
来自主题: Programming版 - 春运火车票2个方案比较
我是不明白Cassandra是怎么工作的。
我一直在问,你的failover方案里面是怎么做网卡IO里面的买票请求的failover的:
你的写数据库的server,网卡IO一收到订票请求就往Cassandra上面扔,写log?然后
failover的时候,重新从Cassandra上面吧这些网卡IO收到的,没处理的订票请求通过
log恢复?
如果这是你的failover方案,你的写数据库server完成一次failover得花多少时间?估
计一下就可以了。
我没和你争论每秒一百万次的写。如果连你给的这个假设都不信,我就不费那神看你方
案了。
g*****g
发帖数: 34805
27
来自主题: Programming版 - 春运火车票2个方案比较
还是那句话,魏老师的counter放在内存里,一掉电就挂了。敏感的数据是必须写到硬
盘上的。每张票卖掉了,你都得更新。10万张票的订单进来,假定每订单一张票,你就
必须写硬
盘10万次。而且不更新就会超卖,这根他的设计不符。
我跟你说了无数次,订单直接写到了Cassandra上,Cassandra是fault tolerant的,只要
任何三个结点不坏两个,读写不会有任何影响,也没有丢任何1ms的数据。你还要我解
释failover我怎么解释?
余票数据库跟订单数据库不是一个,读写的只有后台的订单处理程序,不跟用户直接接
触。这里哪来的10万/秒的要求?我说了很多次,票卖完了,后面的订单直接扔掉就行
了,读Cassandra,扔掉,难道还会碰余票数据库?所以写余票数据库的上限就是票的
张数。
f****4
发帖数: 1359
28
来自主题: Programming版 - 春运火车票2个方案比较
我知道你在纠结什么了。
counter放在内存里,敏感的数据log到本地。魏老师的的高频方案是尽量做到0积累(
可行性另说)。我的理解就是网卡IO第一秒进来了10万请求,第二秒又是10万个,但是
第一秒到第二秒只能已经处理了第一秒的10万个请求。并没有对每秒进网卡IO的请求写
log,我在小结里面是认为这10万个请求failover会丢失。
我又看了一遍你的方案。你用Cassandra处理所有的订票请求(对应的是魏老师的网卡
IO进来的还没处理的订票message)。Cassandra能够处理高throughput,提供fault
tolerant。功能上相当于魏老师的单message queue,然后慢慢的把订单请求交给余票
数据库(数据又是集中的)处理。
恩,圆的不错。不过那样的话,这和你的离线终极大杀器还有什么区别?大家写封信,
寄给铁道部,按照邮戳先后时间,抢票。票抢光了,剩下来的信就卖废品了。然后买到
票的人凭收据去银行交钱。还要上Cassandra上web不是自寻烦恼么。

只要
g*****g
发帖数: 34805
29
你光写一个可靠的数据库,又要这么高的性能,一年都不够。都不用说写应用本身,
理论上的极值是没用的。
魏公公开口就要秒Cassandra 1-2数量级,Cassandra值10亿,此人装逼可见一斑。
魏公公如果真那么牛逼,应该是去写个数据库把Cassandra那10亿挣了,不是在这里吹
牛赌誓。
超过常识100倍的东西不可信,就这么简单。不是说不能创新呀,创新不是吹出来的。
T********i
发帖数: 2416
30
好奇cassandra怎么做的。原来cassandra的缺省配置也有可能会丢数据。
不知道那些benchmark是啥配置。
http://wiki.apache.org/cassandra/Durability
g*****g
发帖数: 34805
31
这个前端后端的说法不是J2EE传统意义上的划分。我只是说前端来的订单数据存在
Cassandra里,这个不是内存数据库,是多DC同时写硬盘,至少2个说写好了,才算成功。
后端是出票系统,干的事情就是把单子从Cassandra读出来,把余票数据从Oracle读出
来,拿到银行去处理,更新余票。简单点单线程就好理解了。
我这里说的两个系统,唯一重叠的部分是Cassandra DB。一个写,一个读,没冲突。
g*****g
发帖数: 34805
32
来自主题: Programming版 - AWS cloud 内部做log,大家怎么设计
writing against Cassandra is not difficult, maintaining a Cassandra cluster
is a different story. All I can say is Cassandra is better for this job,
particularly on ec2.
z****e
发帖数: 54598
33
As we at Twitter move away from Mysql towards Cassandra, we've needed a new
way to generate id numbers. There is no sequential id generation facility in
Cassandra, nor should there be.
Cassandra V5
w***g
发帖数: 5958
34
就是像你说的这样,create table的时候把key设计好。如果不行的话就重新create
table再把数据导过去。Cassandra这类分布式的key-value store和传统数据库设计理
念不一样,所以用法也是不一样的。传统的key-value store的index一般就是B+-tree
或者hash table。这两者都假设random disk access,一旦cache不够用了并行读写甚
至单线程读写也就完蛋了。重新导一遍几十G的数据库都很费时费力了。而Cassandra的数
据据我的理解是按log方式存储的,也就是说新的数据来了就往文件最后面添加。这种
情况下就增加了建index的难度和性能。好处则是数据写入非常有效,而且因为有多台
机器多个硬盘同时读写,重新导一遍数据就跟玩似的。而且因为用的廉价硬盘,空间极
大,不在乎多保存几个copy的数据。新兴的互联网公司有点前途的都是指数增长的,也
就是说一个时间段新增的数据量基本和之前所有积累的数据量相当,所以隔断时间重新
导一下可以作为一个常态。
MongoDB跟Cassandra很不一样,更接近传统数据库的设计,... 阅读全帖
g*****g
发帖数: 34805
35
来自主题: Programming版 - HBase的标准应用框架是什么?
Whatever you want to put in MongoDB, you can probably split between
Cassandra and MySQL. It can be a little bit more coding, but you gain
scalability (if in Cassandra), easy maintenance (compared to Mongo), strong
tooling (if in mysql). Add Elastic Search you are set.
I can't think of a strong case where MongoDB is a must. It feels like a half
-hearted solution. Iterate fast while scale reasonably well. It may be a
good thing for startup as a drop-in replacement of MySQL but it may come
back and... 阅读全帖
c******o
发帖数: 1277
36
来自主题: Programming版 - Java Tools and Technologies Landscape for 2014
Compare to SQL, still way better than any sql, has auto sharding, and auto
shard balancing.
And it is easier to use compare to Cassandra, have more common feature with
SQL servers, full json document search.
Compare to Cassandra, MongoDB is heavier, more feature, more consistency,
less availability, harder to do ops/scaling.
If you do anything similar to SQL, but want scale up/out, Mongodb probably
is better than Cassandra. That is why it called a "drop in replacement for
MySQL"
z*******3
发帖数: 13709
37
来自主题: Programming版 - 关于 Java 的 Log 轮子
上cassandra和aop就好了
用java的应该都用spring吧?
用aop可以有效减少各种乱七八糟的log代码
结构也更合理,我针对每一个方法在调用前和后,各做一次拦截
获取相关数据,插入log,不过我不用log4j,找个nosql放
nosql就用来做这个的,cassandra很好
然后查的时候就查cassandra
要不然动不动就要grep,我的天
w**z
发帖数: 8232
38
来自主题: Programming版 - 请教goodbug等大神几个AWS的问题
Netflix 主要用Cassandra。 它的cross region replication是最好用的。只要setup
好,data 都能自动 replicate across data center。 它有现成的snitch
http://www.datastax.com/documentation/cassandra/2.0/cassandra/a
ELB 是用来distribute web traffic 到后台的instance。 autoscaling 是解决后代
instance 不够用的情况下,自动scale up
。等load 下来再scale down
不同region的 fail over, 主要是C* 做好来。其他都简单些。
c*****a
发帖数: 1638
39
来自主题: Programming版 - Spark 和 Dynamodb 之间 如何 连接
写很简单。我没看懂你有啥困难的?在function里面直接写就行了,只是要注意控制
provision
通俗点就像在MR里面在mapper里面开连接写就是了。
读会相对比较麻烦。如果你是说scan的话,2种做法吧,数据量不大就在driver里面读
。数据量大的话就分片到每个tasks里面,然后返回RDD。
dynamo用起来不便宜,如果你们确定数据量很大,其实Cassandra可能更好。但是如果
你们现在没有已有的Cassandra,那么可能TCO Cassandra更贵就是了,因为dynamo你们
可以不用Admin。

connector
w**z
发帖数: 8232
40
不用谢
http://cassandrasummit-datastax.com/registration/?source=
Back by popular demand we’ve extended this exclusive discount and as a
proud Cassandra alumnus, you can get 50% OFF ALL tickets to Cassandra Summit
2015, the world’s largest gathering of Cassandra users.
Reserve Your Ticket Today
Use the promo codes below when checking out
Priority Pass:
JUNEPROMO
Training/Certification:
CASSANDRAVIP50
Priority Pass + Training/Certification:
CASSANDRAVIP50

Limited Time Only. Offer expires 07/... 阅读全帖
z*******3
发帖数: 13709
41
来自主题: Programming版 - Spark + C*
spark是操作数据的工具
cassandra是储存数据的工具
两个用途并不存在很大的重合
所以互相需要,虽然支持hdfs
但是hdfs并不能满足所有人的需要
毕竟很多人是不用hdfs的呀
而且cassandra是ap系统,hdfs太原始,hbase又是cp系统
ap可以tune成ap,反过来就苦逼了
所以逐步都会换到cassandra上去
淘汰掉hdfs都有可能,你应该思考一下为什么c*逐步流行起来
w**z
发帖数: 8232
42
来自主题: Programming版 - 有用riak的吗?
我们几年前evaluate过 riak 和 Cassandra, 最后选了Cassandra. vector clock 太蛋
疼。
而且我run 了一下benchmark, 当时 performance 不如Cassandra. 说说你为什么选
riak?
w**z
发帖数: 8232
43
Cassandra和你有仇? Cassandra durability根本就不是啥卖点。Cassandra 用户大会
,几千人参加,原来都是傻逼。就你那单机全宇宙最牛掰。

journal
b**********5
发帖数: 7881
44
【 以下文字转载自 JobHunting 讨论区 】
发信人: beefcurtain5 (beefcurtain5), 信区: JobHunting
标 题: 谁有个save protocolbuf class from spark streaming to cassandra的example?
发信站: BBS 未名空间站 (Tue Aug 16 04:28:36 2016, 美东)
谁有个save protocolbuf class from spark streaming to cassandra的example?要
java的, 不要scala的。 我就是store 一个protocol buf blob to cassandra from
spark streaming。 我在用datastax driver。
找了半天在网上, 竟然没一个concrete example
t*****y
发帖数: 445
45
来自主题: _SeattleStartup版 - Lessons Netflix Learned from the AWS Outage
On Thursday, April 21st, Amazon experienced a large outage in AWS US-East
which they describe here. This outage was highly publicized because it took
down or severely hampered a number of popular websites that depend on AWS
for hosting. Our post below describes our experience at Netflix with the
outage, and what we've learned from it.
Some Background
Why were some websites impacted while others were not? For Netflix, the
short answer is that our systems are designed explicitly for these sorts of... 阅读全帖
u***r
发帖数: 4825
46
来自主题: Military版 - 【Economist】The top growers of 2012
http://www.economist.com/blogs/theworldin2012/2011/12/top-econo
“LIES, damn lies and statistics”, as Britain’s Benjamin Disraeli
supposedly said—and Mark Twain definitely said. The phrase came to
Cassandra’s mind when ruminating on the “world in figures” section of The
World in 2012, in particular when looking at the predicted rankings for
economic growth in the year ahead.
I have no quarrel with the figures themselves, all drawn from the
acknowledged number-crunchers at the Economist Intelligen... 阅读全帖
B**W
发帖数: 2273
47
来自主题: Military版 - One-Third of Millennials Don't Want Kids
http://www.glamour.com/inspired/blogs/the-conversation/2015/10/
Whether you've recently tied the knot or you're simply creeping toward 30,
you've been asked—perhaps on repeat—whether you want children. And if you'
ve responded with a resounding no, new research shows you're in good company
. In fact, according to the Cassandra Report: Ages and Stages, one-third of
millennials don't want to be mothers.
Of the 75 million millennials, about 25 million don't have a desire to have
children—compared, ... 阅读全帖
B*V
发帖数: 3365
48
http://www.economist.com/blogs/theworldin2012/2011/12/top-econo
“LIES, damn lies and statistics”, as Britain’s Benjamin Disraeli
supposedly said—and Mark Twain definitely said. The phrase came to
Cassandra’s mind when ruminating on the “world in figures” section of The
World in 2012, in particular when looking at the predicted rankings for
economic growth in the year ahead.
I have no quarrel with the figures themselves, all drawn from the
acknowledged number-crunchers at the Economist Intelligen... 阅读全帖
w********9
发帖数: 64
49
Foreign reporters mailbox (2016)
h****[email protected]中国人权
信息发布:[email protected]/* */
[email protected]/* */国驻华使领馆
[email protected]/* */国驻广州总领馆[email protected]/* */
gov.uk(广州领事处)
[email protected]/* */国驻重庆领事馆[email protected]/* */
gov.uk(重庆领事处)
[email protected]/* */国驻上海总领事处
[email protected]/* */奥巴马
[email protected]/* */白宫[email protected]/* */——subscriptions@
subscriptions.usa.gov
n*****[email protected]新唐人
大纪元投稿Email(海外):[email p... 阅读全帖
t**g
发帖数: 3107
50
http://www.foxnews.com/politics/2016/11/01/kept-me-out-jail-top-doj-official-involved-in-clinton-probe-represented-her-campaign-chairman.html
司法部官员负责通知国会关于重新启用的希拉里·克林顿电子邮件探员是一个政治任命
和前私人执业律师谁保持克林顿竞选主席约翰·波德斯塔“监狱”,游说一个税务欺骗
后总统比尔克林顿并领导努力确认总检察长洛雷塔林奇。
2014年6月被确认为立法事务助理总检察长的Peter Kadzik在1998年代表Podesta,独立
顾问Kenneth Starr正在调查Podesta在帮助前克林顿的实习生和女主人Monica
Lewinsky在联合国工作时可能发挥的作用国家。
“神奇的律师。让我失去监狱,“Podesta在2008年9月8日写信给奥巴马助手Cassandra
Butts,根据从Podesta的Gmail帐户和发布的维基解密电子邮件。
克林顿的电子邮件可能会诱骗她
Kadzik的名字在美国联邦调查局对民主党总统候... 阅读全帖
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)