由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 转行做data warehouse的问个学习大数据的问题
相关主题
Hadoop运行时是不是用命令行执行的?Hadoop和Java有什么联系?java的内存管理真是气死我了
能不能在hadoop中用open mpi?关于big data
Flink Sparks Next Wave of Distributed Data Processing怎么自学cloud/big data programming
MapReduce 的思想是怎么发明的?关于mapreduce一问
Hadoop 和Python的数据分析包哪个更值得学习?big data怎么搞定商业报表?
coltzhao的公司还在用mongo吗?是我的错觉么?我觉得google的三架马车其实没啥东西
aws EMR能设置一个mapper吗?c++程序员不要把头埋在沙子里了
spark is slower than java Mapreduce --scala big bulls pls advise请问为什么现在big data的toolkit都是和java有紧密的关系?
相关话题的讨论汇总
话题: data话题: option话题: mapreduce话题: warehouse话题: hadoop
进入Programming版参与讨论
1 (共1页)
u*******g
发帖数: 224
1
我是生物转行做 data warehouse的。 一直在自学。 现在想请教大牛们下一步学习的
priority – 多谢啦。
Option 1: 拿 Hadoop certificate。已经跟着一个online 课程学完了。 理解 HDFS,
MapReduce etc. 但是要拿到certificate, 还得好好读那本definite guide的书, 多
写MapReduce Java codes 等等。
Option 2: 学 coursera 的那个data science系列的课. 课程包括 R,Statistical
Inference, Machine Learning 等等.
我的背景: 有个十年前的CS master. 生物研究中也有用machine learning 的tools。
会一点点R。 也有一些统计背景。
我的理解是hadoop提供海量数据分析的复杂平台。 那在时间有限的情况下, 先学搭建
这个平台呢, 还是数据分析(data science)?
多谢建议。
e*******o
发帖数: 4654
2
do not waste your time on big data.
find a dev position using your cs ms directly.
u*******g
发帖数: 224
3
echo你说的 dev position是指程序员吗?or..? 我40+了, 觉得程序员干不动了啊,
或干不长久。。。

【在 e*******o 的大作中提到】
: do not waste your time on big data.
: find a dev position using your cs ms directly.

1 (共1页)
进入Programming版参与讨论
相关主题
请问为什么现在big data的toolkit都是和java有紧密的关系?Hadoop 和Python的数据分析包哪个更值得学习?
学scala和spark需要什么pre req?coltzhao的公司还在用mongo吗?
试了下spark,不过如此啊aws EMR能设置一个mapper吗?
可以建公司内部的HDFS吗?spark is slower than java Mapreduce --scala big bulls pls advise
Hadoop运行时是不是用命令行执行的?Hadoop和Java有什么联系?java的内存管理真是气死我了
能不能在hadoop中用open mpi?关于big data
Flink Sparks Next Wave of Distributed Data Processing怎么自学cloud/big data programming
MapReduce 的思想是怎么发明的?关于mapreduce一问
相关话题的讨论汇总
话题: data话题: option话题: mapreduce话题: warehouse话题: hadoop