由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - ds要刷leecode吗,
相关主题
求问编程语言的选择,学stat的往DS努力问一下python 或者是 R 里面 gradient boosting model 的问题
scala的主场在数学应用上 (转载)现在PYTHON,SAS, R 在工业界怎么个比例?
我觉得关于datascience最近看到的几个有价值的贴理论化学女生想转行,求建议
Leetcode?Programming Language for AI
学习spark是否需要懂scala?学习哪种语言比较好?
新手请教:大家都用什么软件写 python code?刷kaggle对找工作有用么?
【讲座信息】哪门语言最适合SPARK大数据PYTHON学起来不难,怎么做LEETCODE上的题这么难啊。问怎么搜SORT,SEARCH的题做?
Data Scientist的编程能力Data science/Quant analysis positions
相关话题的讨论汇总
话题: python话题: java话题: scala话题: ds话题: 应数
进入DataSciences版参与讨论
1 (共1页)
w*******e
发帖数: 902
1
应数统计背景, 就是编程都是matlab,R,
编程怎么提高阿, 要刷leecode吗
j*****n
发帖数: 1545
2
你就去面 应数的 DS 就好了。
z**********u
发帖数: 201
3
这还有区别吗?比如怎么能看出来是针对应数的?

【在 j*****n 的大作中提到】
: 你就去面 应数的 DS 就好了。
z*******3
发帖数: 13709
4
编程提高不难,关键是不要走错路,千万不要从c开始学
累死自己也永远搞不过ee转行的程序猿
先java后scala,搞定这两步你就已经比很多ee转行的要强了
ee转行的主要问题是c的影响太深
以至于很难转变过来,那个封装的思想从来没有过
java最好一点就是强行培训人的大脑用oop去思考问题
oop是干活时候给其他人制造最少麻烦的一种paradigm
把自己屁股擦得干净,屎坑少,维护java代码是最容易的
其他包括python在内都会制造不小的麻烦,要各种约束规范which大多数压根不会遵守
只有日本德国这种纪律性较强的民族会有点效果
所以ruby对于大和,scala对于德意志都比较管用
搞定java和spark之后,直接上hadoop和spark,最好找个cloud平台练手
搞明白分布式是怎么回事,爆点nodes/instances
大学里面如果有reserach cloud的话,最好不过了
学习怎么用java或者spark开发libs,以及调用现有的类库和工具
一般ds能做到这一步,我觉得编程能力就相当不错了
z*******3
发帖数: 13709
5
当然我不反对你刷leetcode
算法如果没学过,那这个也还是补一下比较好
P*****6
发帖数: 273
6
要是按你的建议,这哥们(或姐们)的应数长处根本没有发挥
我觉得data scientist 要编代码的多,可是程序猿应聘的也多. 学应数的数量少多了
。他要是先强调modeling,再讲编程,对于某些职位可能更有优势。差别在于,这样的
话, 他的R, 以及可以快速学习的python 可能就有优势。python虽然没有Java robust,
但是开发,检测模型的速度比java快多了吧。然后再是大数据计算。
不过我觉得leetcode以及计算机算法实际是有用的,甚至是很有用的。你的model再好
,慢的如蜗牛,用的面也窄多了。

【在 z*******3 的大作中提到】
: 编程提高不难,关键是不要走错路,千万不要从c开始学
: 累死自己也永远搞不过ee转行的程序猿
: 先java后scala,搞定这两步你就已经比很多ee转行的要强了
: ee转行的主要问题是c的影响太深
: 以至于很难转变过来,那个封装的思想从来没有过
: java最好一点就是强行培训人的大脑用oop去思考问题
: oop是干活时候给其他人制造最少麻烦的一种paradigm
: 把自己屁股擦得干净,屎坑少,维护java代码是最容易的
: 其他包括python在内都会制造不小的麻烦,要各种约束规范which大多数压根不会遵守
: 只有日本德国这种纪律性较强的民族会有点效果

i**a
发帖数: 127
7
会用matlab和R来快速开发检测模型,就不用学python了吧?
g*****o
发帖数: 812
8
我觉得这两运算以外的操作都比较麻烦,比如文本处理,数据库操作

【在 i**a 的大作中提到】
: 会用matlab和R来快速开发检测模型,就不用学python了吧?
l*******m
发帖数: 1096
9
看老板会不会coding

【在 z**********u 的大作中提到】
: 这还有区别吗?比如怎么能看出来是针对应数的?
n*****3
发帖数: 1584
10
R is at least OK now in terms of data manipulation;
R's 文本处理 can be weak, python and perl' regex are sure way better.
about 数据库操作 or nosql, will there be much difference with either
R or python or any other tools?

【在 g*****o 的大作中提到】
: 我觉得这两运算以外的操作都比较麻烦,比如文本处理,数据库操作
相关主题
新手请教:大家都用什么软件写 python code?问一下python 或者是 R 里面 gradient boosting model 的问题
【讲座信息】哪门语言最适合SPARK大数据现在PYTHON,SAS, R 在工业界怎么个比例?
Data Scientist的编程能力理论化学女生想转行,求建议
进入DataSciences版参与讨论
z*******3
发帖数: 13709
11
所以要scala
scala的东西直接就打包就可以下放生产了
python需要用java或者scala重新做一次
慢死了,modelling跟实际prod code是两回事
modelling直接用嘴巴说都可以
要想快,用java就快了
这个自己试一下就明白了
jvm上那些运行效率优化,不是一般程序员能够写出来的
lars bak通过搞这个东西,申请了23项专利
google后来把lars bak弄过去,搞了v8,结果一堆js程序员说
哇好快啊,即便如此,v8比hotspot还是慢了不少
对比vert.x效率和node.js就知道了,网络上随便搜
剩下的python,ruby这些没有办法让lars bak做引擎的语言
运行效率就要更低了
modelling跟语言无关,用什么都可以modelling
python学习也就是半个小时就可以开始写了
脚本很容易的,本质是一样的,java半个小时搞不定
至少前两周会出不少问题,就是无法速成,python可以
python等脚本顶多说是写得不好罢了,写得不好没关系
反正python得脚本也不下放生产,用完就扔掉,写得再好都无用
那既然如此,半个小时学习,足够了
jvm上对于python那种诡异的语法不满意还可以弄groovy
可以搞的很多

robust,

【在 P*****6 的大作中提到】
: 要是按你的建议,这哥们(或姐们)的应数长处根本没有发挥
: 我觉得data scientist 要编代码的多,可是程序猿应聘的也多. 学应数的数量少多了
: 。他要是先强调modeling,再讲编程,对于某些职位可能更有优势。差别在于,这样的
: 话, 他的R, 以及可以快速学习的python 可能就有优势。python虽然没有Java robust,
: 但是开发,检测模型的速度比java快多了吧。然后再是大数据计算。
: 不过我觉得leetcode以及计算机算法实际是有用的,甚至是很有用的。你的model再好
: ,慢的如蜗牛,用的面也窄多了。

z***m
发帖数: 1602
12
EE都用C++,除非是搞firmware的,都不咋用C了
如果刚转,还是用java吧,c++那一堆指针*,看着不舒服

【在 z*******3 的大作中提到】
: 编程提高不难,关键是不要走错路,千万不要从c开始学
: 累死自己也永远搞不过ee转行的程序猿
: 先java后scala,搞定这两步你就已经比很多ee转行的要强了
: ee转行的主要问题是c的影响太深
: 以至于很难转变过来,那个封装的思想从来没有过
: java最好一点就是强行培训人的大脑用oop去思考问题
: oop是干活时候给其他人制造最少麻烦的一种paradigm
: 把自己屁股擦得干净,屎坑少,维护java代码是最容易的
: 其他包括python在内都会制造不小的麻烦,要各种约束规范which大多数压根不会遵守
: 只有日本德国这种纪律性较强的民族会有点效果

z*******3
发帖数: 13709
13

指针被封装和屏蔽掉是一大趋势
现在scala和java这些语言里面
->和*都被赋予了新的定义
用cpp用多了,很多习惯不太好改

【在 z***m 的大作中提到】
: EE都用C++,除非是搞firmware的,都不咋用C了
: 如果刚转,还是用java吧,c++那一堆指针*,看着不舒服

g*****o
发帖数: 812
14
因为文本处理弱,所以输出sql语句也麻烦

【在 n*****3 的大作中提到】
: R is at least OK now in terms of data manipulation;
: R's 文本处理 can be weak, python and perl' regex are sure way better.
: about 数据库操作 or nosql, will there be much difference with either
: R or python or any other tools?

P*****6
发帖数: 273
15
这个难说,python 处理字符串比R强大多了。这个对于处理很多文本,网页相关的工作
很关键。

【在 i**a 的大作中提到】
: 会用matlab和R来快速开发检测模型,就不用学python了吧?
P*****6
发帖数: 273
16
这个难说,python 处理字符串比R强大多了。这个对于处理很多文本,网页相关的工作
很关键。

【在 i**a 的大作中提到】
: 会用matlab和R来快速开发检测模型,就不用学python了吧?
P*****6
发帖数: 273
17
你这个论断有两个问题,可能对于你的行业适用,但是不一定都适用
modelling 要是用嘴巴说就可以的话,大概都是用比较成熟的module,而且scala中还得
有,这个很多建模工作不见得成立
如果工作中python只是学一两天就能用的话,你可能对python的优缺点也不是那么了解
。也许以python为基础倒腾个平台就够用了呢?
我猜你做的都是大项目,那么java+scala可能是最好的选择之一
话说,scala里面有类似R里面data frame 的数据结构吗?没有的话,做初步数据分析
就麻烦不少。

【在 z*******3 的大作中提到】
: 所以要scala
: scala的东西直接就打包就可以下放生产了
: python需要用java或者scala重新做一次
: 慢死了,modelling跟实际prod code是两回事
: modelling直接用嘴巴说都可以
: 要想快,用java就快了
: 这个自己试一下就明白了
: jvm上那些运行效率优化,不是一般程序员能够写出来的
: lars bak通过搞这个东西,申请了23项专利
: google后来把lars bak弄过去,搞了v8,结果一堆js程序员说

z*******3
发帖数: 13709
18
那这个你要涉及到造轮子还是用轮子的老话题了
象jvm,cpython这种轮子如果自己去造
那就非常麻烦了,但是如果不造
cpython真的是很慢,下放生产,效率会出问题
但是如果用jvm的话,python要搞jython,那就更麻烦了
python只能是一种妥协的处理,临时用完就不用了
scala写个data frame可以实现啊,可以自定义各种东西
你了解一下就是了

【在 P*****6 的大作中提到】
: 你这个论断有两个问题,可能对于你的行业适用,但是不一定都适用
: modelling 要是用嘴巴说就可以的话,大概都是用比较成熟的module,而且scala中还得
: 有,这个很多建模工作不见得成立
: 如果工作中python只是学一两天就能用的话,你可能对python的优缺点也不是那么了解
: 。也许以python为基础倒腾个平台就够用了呢?
: 我猜你做的都是大项目,那么java+scala可能是最好的选择之一
: 话说,scala里面有类似R里面data frame 的数据结构吗?没有的话,做初步数据分析
: 就麻烦不少。

j*****n
发帖数: 1545
19
python 在 big data 这个领域就是 jython or subprocess python, 和 jvm
language 不可同日而语,慢的太多了。
w*********y
发帖数: 7895
20
我LG说DS也未必学C,C++,Java的,会调用LIBRARY也是可以的。。。

【在 z*******3 的大作中提到】
: 编程提高不难,关键是不要走错路,千万不要从c开始学
: 累死自己也永远搞不过ee转行的程序猿
: 先java后scala,搞定这两步你就已经比很多ee转行的要强了
: ee转行的主要问题是c的影响太深
: 以至于很难转变过来,那个封装的思想从来没有过
: java最好一点就是强行培训人的大脑用oop去思考问题
: oop是干活时候给其他人制造最少麻烦的一种paradigm
: 把自己屁股擦得干净,屎坑少,维护java代码是最容易的
: 其他包括python在内都会制造不小的麻烦,要各种约束规范which大多数压根不会遵守
: 只有日本德国这种纪律性较强的民族会有点效果

相关主题
Programming Language for AIPYTHON学起来不难,怎么做LEETCODE上的题这么难啊。问怎么搜SORT,SEARCH的题做?
学习哪种语言比较好?Data science/Quant analysis positions
刷kaggle对找工作有用么?说说浅学ML的感受
进入DataSciences版参与讨论
z****e
发帖数: 54598
21
目前封装到java
c和c++不是必需
但是java你还是懂一下比较好
再往上的感觉封装得还不够彻底
简单说就是目前自动化得程度还达不到
等renjin,spark这些都成熟了,可能差不多可以不用java了
现在还不行

【在 w*********y 的大作中提到】
: 我LG说DS也未必学C,C++,Java的,会调用LIBRARY也是可以的。。。
P*****6
发帖数: 273
22
你说得绝对了吧,python 写个小型的分析系统还是可以的。不过我也见过到后来有些
难点不好解决的。让我感觉不如一开始就用java. 所以我觉得咨询导向或研究多一点的
data scientist可以用python.至于投放生产,python两天就证明根本不work,压根没必
要生产。当然,我没用过scala,如果它也这么快,那是很诱人

【在 z*******3 的大作中提到】
: 那这个你要涉及到造轮子还是用轮子的老话题了
: 象jvm,cpython这种轮子如果自己去造
: 那就非常麻烦了,但是如果不造
: cpython真的是很慢,下放生产,效率会出问题
: 但是如果用jvm的话,python要搞jython,那就更麻烦了
: python只能是一种妥协的处理,临时用完就不用了
: scala写个data frame可以实现啊,可以自定义各种东西
: 你了解一下就是了

w*******e
发帖数: 902
23
应数统计背景, 就是编程都是matlab,R,
编程怎么提高阿, 要刷leecode吗
j*****n
发帖数: 1545
24
你就去面 应数的 DS 就好了。
z**********u
发帖数: 201
25
这还有区别吗?比如怎么能看出来是针对应数的?

【在 j*****n 的大作中提到】
: 你就去面 应数的 DS 就好了。
z*******3
发帖数: 13709
26
编程提高不难,关键是不要走错路,千万不要从c开始学
累死自己也永远搞不过ee转行的程序猿
先java后scala,搞定这两步你就已经比很多ee转行的要强了
ee转行的主要问题是c的影响太深
以至于很难转变过来,那个封装的思想从来没有过
java最好一点就是强行培训人的大脑用oop去思考问题
oop是干活时候给其他人制造最少麻烦的一种paradigm
把自己屁股擦得干净,屎坑少,维护java代码是最容易的
其他包括python在内都会制造不小的麻烦,要各种约束规范which大多数压根不会遵守
只有日本德国这种纪律性较强的民族会有点效果
所以ruby对于大和,scala对于德意志都比较管用
搞定java和spark之后,直接上hadoop和spark,最好找个cloud平台练手
搞明白分布式是怎么回事,爆点nodes/instances
大学里面如果有reserach cloud的话,最好不过了
学习怎么用java或者spark开发libs,以及调用现有的类库和工具
一般ds能做到这一步,我觉得编程能力就相当不错了
z*******3
发帖数: 13709
27
当然我不反对你刷leetcode
算法如果没学过,那这个也还是补一下比较好
P*****6
发帖数: 273
28
要是按你的建议,这哥们(或姐们)的应数长处根本没有发挥
我觉得data scientist 要编代码的多,可是程序猿应聘的也多. 学应数的数量少多了
。他要是先强调modeling,再讲编程,对于某些职位可能更有优势。差别在于,这样的
话, 他的R, 以及可以快速学习的python 可能就有优势。python虽然没有Java robust,
但是开发,检测模型的速度比java快多了吧。然后再是大数据计算。
不过我觉得leetcode以及计算机算法实际是有用的,甚至是很有用的。你的model再好
,慢的如蜗牛,用的面也窄多了。

【在 z*******3 的大作中提到】
: 编程提高不难,关键是不要走错路,千万不要从c开始学
: 累死自己也永远搞不过ee转行的程序猿
: 先java后scala,搞定这两步你就已经比很多ee转行的要强了
: ee转行的主要问题是c的影响太深
: 以至于很难转变过来,那个封装的思想从来没有过
: java最好一点就是强行培训人的大脑用oop去思考问题
: oop是干活时候给其他人制造最少麻烦的一种paradigm
: 把自己屁股擦得干净,屎坑少,维护java代码是最容易的
: 其他包括python在内都会制造不小的麻烦,要各种约束规范which大多数压根不会遵守
: 只有日本德国这种纪律性较强的民族会有点效果

i**a
发帖数: 127
29
会用matlab和R来快速开发检测模型,就不用学python了吧?
g*****o
发帖数: 812
30
我觉得这两运算以外的操作都比较麻烦,比如文本处理,数据库操作

【在 i**a 的大作中提到】
: 会用matlab和R来快速开发检测模型,就不用学python了吧?
相关主题
湾区大妈转行做DS或BA,求建议scala的主场在数学应用上 (转载)
Pig UDF written in Python我觉得关于datascience最近看到的几个有价值的贴
求问编程语言的选择,学stat的往DS努力Leetcode?
进入DataSciences版参与讨论
l*******m
发帖数: 1096
31
看老板会不会coding

【在 z**********u 的大作中提到】
: 这还有区别吗?比如怎么能看出来是针对应数的?
n*****3
发帖数: 1584
32
R is at least OK now in terms of data manipulation;
R's 文本处理 can be weak, python and perl' regex are sure way better.
about 数据库操作 or nosql, will there be much difference with either
R or python or any other tools?

【在 g*****o 的大作中提到】
: 我觉得这两运算以外的操作都比较麻烦,比如文本处理,数据库操作
z*******3
发帖数: 13709
33
所以要scala
scala的东西直接就打包就可以下放生产了
python需要用java或者scala重新做一次
慢死了,modelling跟实际prod code是两回事
modelling直接用嘴巴说都可以
要想快,用java就快了
这个自己试一下就明白了
jvm上那些运行效率优化,不是一般程序员能够写出来的
lars bak通过搞这个东西,申请了23项专利
google后来把lars bak弄过去,搞了v8,结果一堆js程序员说
哇好快啊,即便如此,v8比hotspot还是慢了不少
对比vert.x效率和node.js就知道了,网络上随便搜
剩下的python,ruby这些没有办法让lars bak做引擎的语言
运行效率就要更低了
modelling跟语言无关,用什么都可以modelling
python学习也就是半个小时就可以开始写了
脚本很容易的,本质是一样的,java半个小时搞不定
至少前两周会出不少问题,就是无法速成,python可以
python等脚本顶多说是写得不好罢了,写得不好没关系
反正python得脚本也不下放生产,用完就扔掉,写得再好都无用
那既然如此,半个小时学习,足够了
jvm上对于python那种诡异的语法不满意还可以弄groovy
可以搞的很多

robust,

【在 P*****6 的大作中提到】
: 要是按你的建议,这哥们(或姐们)的应数长处根本没有发挥
: 我觉得data scientist 要编代码的多,可是程序猿应聘的也多. 学应数的数量少多了
: 。他要是先强调modeling,再讲编程,对于某些职位可能更有优势。差别在于,这样的
: 话, 他的R, 以及可以快速学习的python 可能就有优势。python虽然没有Java robust,
: 但是开发,检测模型的速度比java快多了吧。然后再是大数据计算。
: 不过我觉得leetcode以及计算机算法实际是有用的,甚至是很有用的。你的model再好
: ,慢的如蜗牛,用的面也窄多了。

z***m
发帖数: 1602
34
EE都用C++,除非是搞firmware的,都不咋用C了
如果刚转,还是用java吧,c++那一堆指针*,看着不舒服

【在 z*******3 的大作中提到】
: 编程提高不难,关键是不要走错路,千万不要从c开始学
: 累死自己也永远搞不过ee转行的程序猿
: 先java后scala,搞定这两步你就已经比很多ee转行的要强了
: ee转行的主要问题是c的影响太深
: 以至于很难转变过来,那个封装的思想从来没有过
: java最好一点就是强行培训人的大脑用oop去思考问题
: oop是干活时候给其他人制造最少麻烦的一种paradigm
: 把自己屁股擦得干净,屎坑少,维护java代码是最容易的
: 其他包括python在内都会制造不小的麻烦,要各种约束规范which大多数压根不会遵守
: 只有日本德国这种纪律性较强的民族会有点效果

z*******3
发帖数: 13709
35

指针被封装和屏蔽掉是一大趋势
现在scala和java这些语言里面
->和*都被赋予了新的定义
用cpp用多了,很多习惯不太好改

【在 z***m 的大作中提到】
: EE都用C++,除非是搞firmware的,都不咋用C了
: 如果刚转,还是用java吧,c++那一堆指针*,看着不舒服

g*****o
发帖数: 812
36
因为文本处理弱,所以输出sql语句也麻烦

【在 n*****3 的大作中提到】
: R is at least OK now in terms of data manipulation;
: R's 文本处理 can be weak, python and perl' regex are sure way better.
: about 数据库操作 or nosql, will there be much difference with either
: R or python or any other tools?

P*****6
发帖数: 273
37
这个难说,python 处理字符串比R强大多了。这个对于处理很多文本,网页相关的工作
很关键。

【在 i**a 的大作中提到】
: 会用matlab和R来快速开发检测模型,就不用学python了吧?
P*****6
发帖数: 273
38
这个难说,python 处理字符串比R强大多了。这个对于处理很多文本,网页相关的工作
很关键。

【在 i**a 的大作中提到】
: 会用matlab和R来快速开发检测模型,就不用学python了吧?
P*****6
发帖数: 273
39
你这个论断有两个问题,可能对于你的行业适用,但是不一定都适用
modelling 要是用嘴巴说就可以的话,大概都是用比较成熟的module,而且scala中还得
有,这个很多建模工作不见得成立
如果工作中python只是学一两天就能用的话,你可能对python的优缺点也不是那么了解
。也许以python为基础倒腾个平台就够用了呢?
我猜你做的都是大项目,那么java+scala可能是最好的选择之一
话说,scala里面有类似R里面data frame 的数据结构吗?没有的话,做初步数据分析
就麻烦不少。

【在 z*******3 的大作中提到】
: 所以要scala
: scala的东西直接就打包就可以下放生产了
: python需要用java或者scala重新做一次
: 慢死了,modelling跟实际prod code是两回事
: modelling直接用嘴巴说都可以
: 要想快,用java就快了
: 这个自己试一下就明白了
: jvm上那些运行效率优化,不是一般程序员能够写出来的
: lars bak通过搞这个东西,申请了23项专利
: google后来把lars bak弄过去,搞了v8,结果一堆js程序员说

z*******3
发帖数: 13709
40
那这个你要涉及到造轮子还是用轮子的老话题了
象jvm,cpython这种轮子如果自己去造
那就非常麻烦了,但是如果不造
cpython真的是很慢,下放生产,效率会出问题
但是如果用jvm的话,python要搞jython,那就更麻烦了
python只能是一种妥协的处理,临时用完就不用了
scala写个data frame可以实现啊,可以自定义各种东西
你了解一下就是了

【在 P*****6 的大作中提到】
: 你这个论断有两个问题,可能对于你的行业适用,但是不一定都适用
: modelling 要是用嘴巴说就可以的话,大概都是用比较成熟的module,而且scala中还得
: 有,这个很多建模工作不见得成立
: 如果工作中python只是学一两天就能用的话,你可能对python的优缺点也不是那么了解
: 。也许以python为基础倒腾个平台就够用了呢?
: 我猜你做的都是大项目,那么java+scala可能是最好的选择之一
: 话说,scala里面有类似R里面data frame 的数据结构吗?没有的话,做初步数据分析
: 就麻烦不少。

相关主题
Leetcode?【讲座信息】哪门语言最适合SPARK大数据
学习spark是否需要懂scala?Data Scientist的编程能力
新手请教:大家都用什么软件写 python code?问一下python 或者是 R 里面 gradient boosting model 的问题
进入DataSciences版参与讨论
j*****n
发帖数: 1545
41
python 在 big data 这个领域就是 jython or subprocess python, 和 jvm
language 不可同日而语,慢的太多了。
w*********y
发帖数: 7895
42
我LG说DS也未必学C,C++,Java的,会调用LIBRARY也是可以的。。。

【在 z*******3 的大作中提到】
: 编程提高不难,关键是不要走错路,千万不要从c开始学
: 累死自己也永远搞不过ee转行的程序猿
: 先java后scala,搞定这两步你就已经比很多ee转行的要强了
: ee转行的主要问题是c的影响太深
: 以至于很难转变过来,那个封装的思想从来没有过
: java最好一点就是强行培训人的大脑用oop去思考问题
: oop是干活时候给其他人制造最少麻烦的一种paradigm
: 把自己屁股擦得干净,屎坑少,维护java代码是最容易的
: 其他包括python在内都会制造不小的麻烦,要各种约束规范which大多数压根不会遵守
: 只有日本德国这种纪律性较强的民族会有点效果

z****e
发帖数: 54598
43
目前封装到java
c和c++不是必需
但是java你还是懂一下比较好
再往上的感觉封装得还不够彻底
简单说就是目前自动化得程度还达不到
等renjin,spark这些都成熟了,可能差不多可以不用java了
现在还不行

【在 w*********y 的大作中提到】
: 我LG说DS也未必学C,C++,Java的,会调用LIBRARY也是可以的。。。
P*****6
发帖数: 273
44
你说得绝对了吧,python 写个小型的分析系统还是可以的。不过我也见过到后来有些
难点不好解决的。让我感觉不如一开始就用java. 所以我觉得咨询导向或研究多一点的
data scientist可以用python.至于投放生产,python两天就证明根本不work,压根没必
要生产。当然,我没用过scala,如果它也这么快,那是很诱人

【在 z*******3 的大作中提到】
: 那这个你要涉及到造轮子还是用轮子的老话题了
: 象jvm,cpython这种轮子如果自己去造
: 那就非常麻烦了,但是如果不造
: cpython真的是很慢,下放生产,效率会出问题
: 但是如果用jvm的话,python要搞jython,那就更麻烦了
: python只能是一种妥协的处理,临时用完就不用了
: scala写个data frame可以实现啊,可以自定义各种东西
: 你了解一下就是了

C*******a
发帖数: 448
45
数据处理用java,那是自己和自己过不去。

【在 z*******3 的大作中提到】
: 编程提高不难,关键是不要走错路,千万不要从c开始学
: 累死自己也永远搞不过ee转行的程序猿
: 先java后scala,搞定这两步你就已经比很多ee转行的要强了
: ee转行的主要问题是c的影响太深
: 以至于很难转变过来,那个封装的思想从来没有过
: java最好一点就是强行培训人的大脑用oop去思考问题
: oop是干活时候给其他人制造最少麻烦的一种paradigm
: 把自己屁股擦得干净,屎坑少,维护java代码是最容易的
: 其他包括python在内都会制造不小的麻烦,要各种约束规范which大多数压根不会遵守
: 只有日本德国这种纪律性较强的民族会有点效果

C*******a
发帖数: 448
46
有必要澄清一下,
python是完全的oop,python可以完全体现数据结构和算法,python的代码可以无难度
改写为java,怎么叫用完就扔。
在两种语言都非常精通之前,不能妄言比较。

【在 z*******3 的大作中提到】
: 所以要scala
: scala的东西直接就打包就可以下放生产了
: python需要用java或者scala重新做一次
: 慢死了,modelling跟实际prod code是两回事
: modelling直接用嘴巴说都可以
: 要想快,用java就快了
: 这个自己试一下就明白了
: jvm上那些运行效率优化,不是一般程序员能够写出来的
: lars bak通过搞这个东西,申请了23项专利
: google后来把lars bak弄过去,搞了v8,结果一堆js程序员说

1 (共1页)
进入DataSciences版参与讨论
相关主题
Data science/Quant analysis positions学习spark是否需要懂scala?
说说浅学ML的感受新手请教:大家都用什么软件写 python code?
湾区大妈转行做DS或BA,求建议【讲座信息】哪门语言最适合SPARK大数据
Pig UDF written in PythonData Scientist的编程能力
求问编程语言的选择,学stat的往DS努力问一下python 或者是 R 里面 gradient boosting model 的问题
scala的主场在数学应用上 (转载)现在PYTHON,SAS, R 在工业界怎么个比例?
我觉得关于datascience最近看到的几个有价值的贴理论化学女生想转行,求建议
Leetcode?Programming Language for AI
相关话题的讨论汇总
话题: python话题: java话题: scala话题: ds话题: 应数