s******e 发帖数: 128 | 1 如果只是想说明自己对big data,cloud computing 有一定的了解,学哪几个名词比较
快,不用setup/install东西? |
p*****2 发帖数: 21240 | 2 big data:
hadoop
NOSQL
machine learning
data mining
cloud:
distributed storage
distributed computing
virtualization
low latency
high throughput
high availability
high scalability
fail over
fault tolerance |
s******e 发帖数: 128 | 3 cloud 那段和学网络差不多的词?
big data: hadoop 听说要装个东西?我其实前一阵看了一下。没敢写在resume上,因
为没装过东西,
【在 p*****2 的大作中提到】 : big data: : hadoop : NOSQL : machine learning : data mining : cloud: : distributed storage : distributed computing : virtualization : low latency
|
S******6 发帖数: 55 | |
r*******h 发帖数: 315 | 5 cloud computing从业界的角度:
SaaS
PaaS
IaaS
Xen(PVM/HVM)
Configuration Management
etc. |
s******e 发帖数: 128 | 6 mapreduce 我的理解就是split大数据到多机上算完, 再merge到一机上德最终结果的
一种方法。知道这点敢写到resume吗。可我看就是这意思。
【在 S******6 的大作中提到】 : 补一个 mapreduce
|
y******u 发帖数: 804 | 7 前一半对了,merge/reduce 还是在多机上,结果还是可以存在多机上。
【在 s******e 的大作中提到】 : mapreduce 我的理解就是split大数据到多机上算完, 再merge到一机上德最终结果的 : 一种方法。知道这点敢写到resume吗。可我看就是这意思。
|
c*****o 发帖数: 1702 | 8 那你就装下呗,很简单,研究个2天就能装上了,实在不行用cloudera的virtual
machine |
m********s 发帖数: 55301 | 9 为啥不写?
【在 s******e 的大作中提到】 : mapreduce 我的理解就是split大数据到多机上算完, 再merge到一机上德最终结果的 : 一种方法。知道这点敢写到resume吗。可我看就是这意思。
|
t*********h 发帖数: 941 | 10 重点是怎么split 怎么merge 随便问你一个怎么把现有算法改成mapreduce你就跪了∑
【在 s******e 的大作中提到】 : mapreduce 我的理解就是split大数据到多机上算完, 再merge到一机上德最终结果的 : 一种方法。知道这点敢写到resume吗。可我看就是这意思。
|
|
|
s******e 发帖数: 128 | 11 如果是简单data就hash mod, 怎么merge和具体题目有关吧。我就知道这些。
看样子会不会不是看看tutorial可以解决的。
【在 t*********h 的大作中提到】 : 重点是怎么split 怎么merge 随便问你一个怎么把现有算法改成mapreduce你就跪了∑
|
s******e 发帖数: 128 | 12 准备学一下hadoop。
我的理解是如果一个数据由各种各样形式:video, image, text...组成,是没法用SQL
等相对数据库存的 data,就叫NOSQL。
有人学过aws吗? 网上有个一日教程,不知道值不值得花这个时间
【在 p*****2 的大作中提到】 : big data: : hadoop : NOSQL : machine learning : data mining : cloud: : distributed storage : distributed computing : virtualization : low latency
|
s******e 发帖数: 128 | 13 你的意思是不是说只要merge/reduce 了就是map reduce?
不是一定存在一台机上,也有可能多机?
【在 y******u 的大作中提到】 : 前一半对了,merge/reduce 还是在多机上,结果还是可以存在多机上。
|
y******u 发帖数: 804 | 14 就写个mapreduce玩玩,不用下什么hadoop,玩玩这个python小程序就行了
https://github.com/michaelfairley/mincemeatpy
【在 s******e 的大作中提到】 : 你的意思是不是说只要merge/reduce 了就是map reduce? : 不是一定存在一台机上,也有可能多机?
|
s******e 发帖数: 128 | 15 谢谢。 自己用普通的python写过word count. 和他完全不一样的感觉。要好好学一下。
【在 y******u 的大作中提到】 : 就写个mapreduce玩玩,不用下什么hadoop,玩玩这个python小程序就行了 : https://github.com/michaelfairley/mincemeatpy
|