P*****6 发帖数: 273 | 1 你这个论断有两个问题,可能对于你的行业适用,但是不一定都适用
modelling 要是用嘴巴说就可以的话,大概都是用比较成熟的module,而且scala中还得
有,这个很多建模工作不见得成立
如果工作中python只是学一两天就能用的话,你可能对python的优缺点也不是那么了解
。也许以python为基础倒腾个平台就够用了呢?
我猜你做的都是大项目,那么java+scala可能是最好的选择之一
话说,scala里面有类似R里面data frame 的数据结构吗?没有的话,做初步数据分析
就麻烦不少。 |
|
z*******3 发帖数: 13709 | 2 那这个你要涉及到造轮子还是用轮子的老话题了
象jvm,cpython这种轮子如果自己去造
那就非常麻烦了,但是如果不造
cpython真的是很慢,下放生产,效率会出问题
但是如果用jvm的话,python要搞jython,那就更麻烦了
python只能是一种妥协的处理,临时用完就不用了
scala写个data frame可以实现啊,可以自定义各种东西
你了解一下就是了 |
|
j*****n 发帖数: 1545 | 3 python 在 big data 这个领域就是 jython or subprocess python, 和 jvm
language 不可同日而语,慢的太多了。 |
|
w*********y 发帖数: 7895 | 4 我LG说DS也未必学C,C++,Java的,会调用LIBRARY也是可以的。。。 |
|
z****e 发帖数: 54598 | 5 目前封装到java
c和c++不是必需
但是java你还是懂一下比较好
再往上的感觉封装得还不够彻底
简单说就是目前自动化得程度还达不到
等renjin,spark这些都成熟了,可能差不多可以不用java了
现在还不行 |
|
P*****6 发帖数: 273 | 6 你说得绝对了吧,python 写个小型的分析系统还是可以的。不过我也见过到后来有些
难点不好解决的。让我感觉不如一开始就用java. 所以我觉得咨询导向或研究多一点的
data scientist可以用python.至于投放生产,python两天就证明根本不work,压根没必
要生产。当然,我没用过scala,如果它也这么快,那是很诱人 |
|
|
|
z*******3 发帖数: 13709 | 9 编程提高不难,关键是不要走错路,千万不要从c开始学
累死自己也永远搞不过ee转行的程序猿
先java后scala,搞定这两步你就已经比很多ee转行的要强了
ee转行的主要问题是c的影响太深
以至于很难转变过来,那个封装的思想从来没有过
java最好一点就是强行培训人的大脑用oop去思考问题
oop是干活时候给其他人制造最少麻烦的一种paradigm
把自己屁股擦得干净,屎坑少,维护java代码是最容易的
其他包括python在内都会制造不小的麻烦,要各种约束规范which大多数压根不会遵守
只有日本德国这种纪律性较强的民族会有点效果
所以ruby对于大和,scala对于德意志都比较管用
搞定java和spark之后,直接上hadoop和spark,最好找个cloud平台练手
搞明白分布式是怎么回事,爆点nodes/instances
大学里面如果有reserach cloud的话,最好不过了
学习怎么用java或者spark开发libs,以及调用现有的类库和工具
一般ds能做到这一步,我觉得编程能力就相当不错了 |
|
z*******3 发帖数: 13709 | 10 当然我不反对你刷leetcode
算法如果没学过,那这个也还是补一下比较好 |
|
P*****6 发帖数: 273 | 11 要是按你的建议,这哥们(或姐们)的应数长处根本没有发挥
我觉得data scientist 要编代码的多,可是程序猿应聘的也多. 学应数的数量少多了
。他要是先强调modeling,再讲编程,对于某些职位可能更有优势。差别在于,这样的
话, 他的R, 以及可以快速学习的python 可能就有优势。python虽然没有Java robust,
但是开发,检测模型的速度比java快多了吧。然后再是大数据计算。
不过我觉得leetcode以及计算机算法实际是有用的,甚至是很有用的。你的model再好
,慢的如蜗牛,用的面也窄多了。 |
|
i**a 发帖数: 127 | 12 会用matlab和R来快速开发检测模型,就不用学python了吧? |
|
g*****o 发帖数: 812 | 13 我觉得这两运算以外的操作都比较麻烦,比如文本处理,数据库操作 |
|
|
n*****3 发帖数: 1584 | 15 R is at least OK now in terms of data manipulation;
R's 文本处理 can be weak, python and perl' regex are sure way better.
about 数据库操作 or nosql, will there be much difference with either
R or python or any other tools? |
|
z*******3 发帖数: 13709 | 16 所以要scala
scala的东西直接就打包就可以下放生产了
python需要用java或者scala重新做一次
慢死了,modelling跟实际prod code是两回事
modelling直接用嘴巴说都可以
要想快,用java就快了
这个自己试一下就明白了
jvm上那些运行效率优化,不是一般程序员能够写出来的
lars bak通过搞这个东西,申请了23项专利
google后来把lars bak弄过去,搞了v8,结果一堆js程序员说
哇好快啊,即便如此,v8比hotspot还是慢了不少
对比vert.x效率和node.js就知道了,网络上随便搜
剩下的python,ruby这些没有办法让lars bak做引擎的语言
运行效率就要更低了
modelling跟语言无关,用什么都可以modelling
python学习也就是半个小时就可以开始写了
脚本很容易的,本质是一样的,java半个小时搞不定
至少前两周会出不少问题,就是无法速成,python可以
python等脚本顶多说是写得不好罢了,写得不好没关系
反正python得脚本也不下放生产,用完就扔掉,写得再好都无用
那既然如此,半个小... 阅读全帖 |
|
z***m 发帖数: 1602 | 17 EE都用C++,除非是搞firmware的,都不咋用C了
如果刚转,还是用java吧,c++那一堆指针*,看着不舒服 |
|
z*******3 发帖数: 13709 | 18 然
指针被封装和屏蔽掉是一大趋势
现在scala和java这些语言里面
->和*都被赋予了新的定义
用cpp用多了,很多习惯不太好改 |
|
|
P*****6 发帖数: 273 | 20 这个难说,python 处理字符串比R强大多了。这个对于处理很多文本,网页相关的工作
很关键。 |
|
P*****6 发帖数: 273 | 21 这个难说,python 处理字符串比R强大多了。这个对于处理很多文本,网页相关的工作
很关键。 |
|
P*****6 发帖数: 273 | 22 你这个论断有两个问题,可能对于你的行业适用,但是不一定都适用
modelling 要是用嘴巴说就可以的话,大概都是用比较成熟的module,而且scala中还得
有,这个很多建模工作不见得成立
如果工作中python只是学一两天就能用的话,你可能对python的优缺点也不是那么了解
。也许以python为基础倒腾个平台就够用了呢?
我猜你做的都是大项目,那么java+scala可能是最好的选择之一
话说,scala里面有类似R里面data frame 的数据结构吗?没有的话,做初步数据分析
就麻烦不少。 |
|
z*******3 发帖数: 13709 | 23 那这个你要涉及到造轮子还是用轮子的老话题了
象jvm,cpython这种轮子如果自己去造
那就非常麻烦了,但是如果不造
cpython真的是很慢,下放生产,效率会出问题
但是如果用jvm的话,python要搞jython,那就更麻烦了
python只能是一种妥协的处理,临时用完就不用了
scala写个data frame可以实现啊,可以自定义各种东西
你了解一下就是了 |
|
j*****n 发帖数: 1545 | 24 python 在 big data 这个领域就是 jython or subprocess python, 和 jvm
language 不可同日而语,慢的太多了。 |
|
w*********y 发帖数: 7895 | 25 我LG说DS也未必学C,C++,Java的,会调用LIBRARY也是可以的。。。 |
|
z****e 发帖数: 54598 | 26 目前封装到java
c和c++不是必需
但是java你还是懂一下比较好
再往上的感觉封装得还不够彻底
简单说就是目前自动化得程度还达不到
等renjin,spark这些都成熟了,可能差不多可以不用java了
现在还不行 |
|
P*****6 发帖数: 273 | 27 你说得绝对了吧,python 写个小型的分析系统还是可以的。不过我也见过到后来有些
难点不好解决的。让我感觉不如一开始就用java. 所以我觉得咨询导向或研究多一点的
data scientist可以用python.至于投放生产,python两天就证明根本不work,压根没必
要生产。当然,我没用过scala,如果它也这么快,那是很诱人 |
|
|
C*******a 发帖数: 448 | 29 有必要澄清一下,
python是完全的oop,python可以完全体现数据结构和算法,python的代码可以无难度
改写为java,怎么叫用完就扔。
在两种语言都非常精通之前,不能妄言比较。 |
|
m*********3 发帖数: 1425 | 30 在学习R和SAS,总觉得操作不熟练,请问哪里可以找一些免费的project练习?我知道CS
有leecode可以锻炼。谢谢。 |
|
w*********y 发帖数: 7895 | 31 Google, Jobhunting Board at MITBBS, leecode, CC150 |
|
p******e 发帖数: 528 | 32 确实是很有用的信息。看了这个list后,我有一个问题。要都准备这里所列举的东西
需要很长时间。比方说Python编程,要是考起算法的话得准备leecode。对于没有
CS背景的人时间不会很短。然后这里还有很多统计的知识。对于一般的数学系或者
是工程系的人来说并不是他们以前所学的内容。一般来说准备所有这些怎么也得有1
到2年左右的时间。请问这是不是意味着一般来说,我们需要很长的时间才能准备好。 |
|
p******e 发帖数: 528 | 33 确实是很有用的信息。看了这个list后,我有一个问题。要都准备这里所列举的东西
需要很长时间。比方说Python编程,要是考起算法的话得准备leecode。对于没有
CS背景的人时间不会很短。然后这里还有很多统计的知识。对于一般的数学系或者
是工程系的人来说并不是他们以前所学的内容。一般来说准备所有这些怎么也得有1
到2年左右的时间。请问这是不是意味着一般来说,我们需要很长的时间才能准备好。 |
|