e*******n 发帖数: 872 | 1 1. programming: Java, Python, C++, Ruby, Matlab, Perl
2. Database: SQL, NonSQL (HBase, MongoDB)
3. Statistics: R, SPSS, SAS, A/B testing, Tableau (Visualization)
4. Hadoop: MapReduce, Hive, Pig
5. Machine Learning: Predictive Modeling, Neural Networks, Regression,
Clustering, Decision Trees (CART), Boostrapping, Random Forest,
Collaborative Filtering, Text Mining, Social Network Analysis,
Recommendation
看了很多data scientist的招聘要求,总结出来的五个方面 | r**d 发帖数: 6 | | z****e 发帖数: 54598 | 3 不用搞那么麻烦
其实就是最基本的
编程基础,这个会java,python,再对常见类库熟悉一下
就可以了,这两个随便一个展开都是非常大的topic
你一辈子学都学不完,公司不可能要求你全部都懂的
然后是理论基础,统计知识这些
hadoop这些严格说来只是一个工具,懂得利用这些工具就好了 | f*****y 发帖数: 822 | 4 赞楼主的Summary!
【在 e*******n 的大作中提到】 : 1. programming: Java, Python, C++, Ruby, Matlab, Perl : 2. Database: SQL, NonSQL (HBase, MongoDB) : 3. Statistics: R, SPSS, SAS, A/B testing, Tableau (Visualization) : 4. Hadoop: MapReduce, Hive, Pig : 5. Machine Learning: Predictive Modeling, Neural Networks, Regression, : Clustering, Decision Trees (CART), Boostrapping, Random Forest, : Collaborative Filtering, Text Mining, Social Network Analysis, : Recommendation : 看了很多data scientist的招聘要求,总结出来的五个方面
| j*****n 发帖数: 1545 | 5 totally agree. programming + math, all you need.
【在 z****e 的大作中提到】 : 不用搞那么麻烦 : 其实就是最基本的 : 编程基础,这个会java,python,再对常见类库熟悉一下 : 就可以了,这两个随便一个展开都是非常大的topic : 你一辈子学都学不完,公司不可能要求你全部都懂的 : 然后是理论基础,统计知识这些 : hadoop这些严格说来只是一个工具,懂得利用这些工具就好了
| h****0 发帖数: 3 | 6 1) sparse index implication
2) framework in processing data across machine boundary
??? |
|