b***y 发帖数: 740 | 1 今天听了一个talk,主要讲Hadoop的发展起来的过程。
基本上事件发展的模式就是:
1. Google发表了一个paper
2. Somebody or some company (Yahoo) 看到了,拿起来做了一个系统,然后捐献给
Apache
3. Google发表了一个paper
4. Somebody or some company (Yahoo) 看到了,拿起来做了一个系统,然后捐献给
Apache
5. Google发表了一个paper
6. Somebody or some company (Yahoo) 看到了,拿起来做了一个系统,然后捐献给
Apache
7. And so on ....
总体上来说Google的核心系统从来都很少开源,最多就是发个paper。然后Yahoo把它做
成开源project,最后是那些startup(Twitter, Facebook, etc)得益最大。Google和开
源社区的关系很有意思,而Yahoo是最大的活雷锋。 |
g*****g 发帖数: 34805 | 2 这个事情说的也不太对。我有个同学是狗狗mapreduce team的。跟他聊过一次。说狗狗
并不是不想开源,而是mapreduce用的proprietary的文件系统,不好开源。
yahoo也不是活雷锋。这东西是个工具,不是核心算法,开源可以获得大量开源社区的
开发和测试支持,从而减少开支,加快进度。
【在 b***y 的大作中提到】 : 今天听了一个talk,主要讲Hadoop的发展起来的过程。 : 基本上事件发展的模式就是: : 1. Google发表了一个paper : 2. Somebody or some company (Yahoo) 看到了,拿起来做了一个系统,然后捐献给 : Apache : 3. Google发表了一个paper : 4. Somebody or some company (Yahoo) 看到了,拿起来做了一个系统,然后捐献给 : Apache : 5. Google发表了一个paper : 6. Somebody or some company (Yahoo) 看到了,拿起来做了一个系统,然后捐献给
|
t********e 发帖数: 1169 | 3 hadoop读写性能还是不行,基本是沿着gfs/mapreduce/bigtable/megastore抄的, 系统
的东西居然用java来写。。。
G现在又出了spanner了, 又够雅虎抄好一阵子了。 |
g*****g 发帖数: 34805 | 4 差距在IO上,跟Java有啥关系。关系大的是文件系统。
【在 t********e 的大作中提到】 : hadoop读写性能还是不行,基本是沿着gfs/mapreduce/bigtable/megastore抄的, 系统 : 的东西居然用java来写。。。 : G现在又出了spanner了, 又够雅虎抄好一阵子了。
|