由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - Java码农转data science行业,有没有一起的 (转载)
相关主题
pandas 作者:Apache Arrow and the "10 Things I Hate About pandas"大侠们说说C(C++)或Fortran比较Matlab到底优点在哪儿?
求python大牛指路Python的问题
Anaconda装起来会跟已有的python dist有什么冲突吗?请教python中如何向文件写入矩阵
易写性,易维护和执行效率综合来看[合集] scipy还是matlab
python在2009年差点死掉,后来为什么起死回生了?[合集] Python下面如何进行numeric analysis and statistical analysis
data.table谁用过? 有那么神吗?有matplotlib或numpy/scipy的同学帮我试试
dataframe和SQL最大区别是什么呢也谈谈语言之争
有人上Spark用python API的么SciPy and NumPy
相关话题的讨论汇总
话题: scipy话题: python话题: sas话题: java话题: numpy
进入Programming版参与讨论
1 (共1页)
l*y
发帖数: 21010
1
【 以下文字转载自 JobHunting 讨论区 】
发信人: ldy (大才001), 信区: JobHunting
标 题: Java码农转data science行业,有没有一起的
发信站: BBS 未名空间站 (Wed Mar 2 23:20:18 2016, 美东)
实在受不了无尽的production issue救火,on call。
学习各种层出不穷的framework,无非就是去适应某些人提出来的做事方式而已,研究
各种API轮子怎么用,整天忙于解决一些很琐碎无聊的问题。不断地加班,无尽的
crunch time,没有work life balance。
当初上学时候学的算法、数学完全派不上用场,感觉整个人变得消沉、无趣。
data science行业是一盏明灯,是我觉得唯一一个结合了数学和编程的需求较大的职业
方向。我昨天辞掉了我芝加哥年薪10万的java developer工作,开始全心全意转行学统
计、学r、学ETL,开始转行之路!
n******7
发帖数: 12463
2
能不学R就不要学R
我计划用scala或者python代替R
l*********s
发帖数: 5409
3
job security, man. :-(
w********m
发帖数: 1137
4
挖的坑一点技术含量都没有
java有啥层出不穷的framework?
l*y
发帖数: 21010
5
前端

【在 w********m 的大作中提到】
: 挖的坑一点技术含量都没有
: java有啥层出不穷的framework?

r***y
发帖数: 4379
6
跳坑...
web前端是 JS 的世界不是一天两天了, Java 只是在后缩.
data science 也不是短时间能上手的, 整天琢磨数据咋用不喜好也不是啥轻省活.
码工背景上大蟒比R那一坨... 要来的灵活清爽吧
l*y
发帖数: 21010
7
python当然好弄,但R和SAS也都需要熟悉一下

【在 r***y 的大作中提到】
: 跳坑...
: web前端是 JS 的世界不是一天两天了, Java 只是在后缩.
: data science 也不是短时间能上手的, 整天琢磨数据咋用不喜好也不是啥轻省活.
: 码工背景上大蟒比R那一坨... 要来的灵活清爽吧

r***y
发帖数: 4379
8
python ecosystem 下面一坨一坨的也要堆时间的, 光scipy下面就够忙活一阵.
SAS 快让R和Python整的没活路了. 码工背景你弄SAS 干啥, 那都是给不太能码的统计
背景的人用的.

【在 l*y 的大作中提到】
: python当然好弄,但R和SAS也都需要熟悉一下
l*y
发帖数: 21010
9
你说的是没错。不过就是打算随手用用SAS,也没想太钻研。

【在 r***y 的大作中提到】
: python ecosystem 下面一坨一坨的也要堆时间的, 光scipy下面就够忙活一阵.
: SAS 快让R和Python整的没活路了. 码工背景你弄SAS 干啥, 那都是给不太能码的统计
: 背景的人用的.

n*****3
发帖数: 1584
10
for python, I think most of the time, use pandas/sicl-learn, who
needs numpy/scipy?

【在 r***y 的大作中提到】
: python ecosystem 下面一坨一坨的也要堆时间的, 光scipy下面就够忙活一阵.
: SAS 快让R和Python整的没活路了. 码工背景你弄SAS 干啥, 那都是给不太能码的统计
: 背景的人用的.

相关主题
data.table谁用过? 有那么神吗?大侠们说说C(C++)或Fortran比较Matlab到底优点在哪儿?
dataframe和SQL最大区别是什么呢Python的问题
有人上Spark用python API的么请教python中如何向文件写入矩阵
进入Programming版参与讨论
n******7
发帖数: 12463
11
统计的东西主要中scipy下面
numpy是这些的基础

【在 n*****3 的大作中提到】
: for python, I think most of the time, use pandas/sicl-learn, who
: needs numpy/scipy?

r***y
发帖数: 4379
12
你说的就是一个东西, 连scipy包括啥都没搞清楚

【在 n*****3 的大作中提到】
: for python, I think most of the time, use pandas/sicl-learn, who
: needs numpy/scipy?

w********m
发帖数: 1137
13
奇怪R为什么没有hash table。
这个丢很多分。
n******7
发帖数: 12463
14
用list凑合吧
R本来就只是个统计计算环境,最初是splus的开源实现
R的正确用法是先用别的语言搞定一切,R做个分析,完事

【在 w********m 的大作中提到】
: 奇怪R为什么没有hash table。
: 这个丢很多分。

x***4
发帖数: 1815
15
传统统计用r,ml用python,算法定下来要推到big data再换scala

【在 n******7 的大作中提到】
: 能不学R就不要学R
: 我计划用scala或者python代替R

a*f
发帖数: 1790
16
再好的工具也可以做出很烂的系统
做得好的系统几个月可以一个ticket都没有

【在 l*y 的大作中提到】
: 你说的是没错。不过就是打算随手用用SAS,也没想太钻研。
n*****3
发帖数: 1584
17
they are not!
pandas is copy cat of R dataframe/plyr.....
numpy/scipy are more like matlab, array/matrix based....
I do NOT think many DS guys like to use numpy or scipy directly now.

【在 r***y 的大作中提到】
: 你说的就是一个东西, 连scipy包括啥都没搞清楚
G****e
发帖数: 293
18
咱没有马工背景和脑子,有一定的统计基础。
现在每天在做的基本就是tableau,excel和spss
我个人准备走的路子是
先过了SAS的初级和高级,甭管有用没用,证书先拿着。
然后推R和python,如果能再懂点JS就更美好了。
总之就是打擦边球:
比纯数据库的或者马工懂统计原理
比纯统计的懂前端
当然最后可能两边不讨好,啥都会点,啥都不精。。。
l*y
发帖数: 21010
19
问题就是大部分公司系统都烂。这是事实。所以从概率上讲,你应该假定下一份工作的
系统还是烂。

【在 a*f 的大作中提到】
: 再好的工具也可以做出很烂的系统
: 做得好的系统几个月可以一个ticket都没有

r***y
发帖数: 4379
20
我晕死了
那些都是 scipy.org 的子项目. 我说"scipy下面"那一坨就指它们.
我在说ecosystem, 你在说这个ecosystem 下面具体的出场人物.
就像我说人要摄取蛋白质得吃肉
你非说谁吃肉啊, 我们都吃板鸭和龙虾...

【在 n*****3 的大作中提到】
: they are not!
: pandas is copy cat of R dataframe/plyr.....
: numpy/scipy are more like matlab, array/matrix based....
: I do NOT think many DS guys like to use numpy or scipy directly now.

相关主题
[合集] scipy还是matlab也谈谈语言之争
[合集] Python下面如何进行numeric analysis and statistical analysisSciPy and NumPy
有matplotlib或numpy/scipy的同学帮我试试python3还是python?
进入Programming版参与讨论
a*f
发帖数: 1790
21
别人的烂系统=我们的job security
系统越多问题才好

【在 l*y 的大作中提到】
: 问题就是大部分公司系统都烂。这是事实。所以从概率上讲,你应该假定下一份工作的
: 系统还是烂。

n******7
发帖数: 12463
22
那你定位的工作是什么样的?
我有类似的想法
但是感觉现在社会分工很细
这种蝙蝠类的不能独挡一面,似乎机会不多阿

【在 G****e 的大作中提到】
: 咱没有马工背景和脑子,有一定的统计基础。
: 现在每天在做的基本就是tableau,excel和spss
: 我个人准备走的路子是
: 先过了SAS的初级和高级,甭管有用没用,证书先拿着。
: 然后推R和python,如果能再懂点JS就更美好了。
: 总之就是打擦边球:
: 比纯数据库的或者马工懂统计原理
: 比纯统计的懂前端
: 当然最后可能两边不讨好,啥都会点,啥都不精。。。

n*****3
发帖数: 1584
23
they are more like pydata now..

【在 r***y 的大作中提到】
: 我晕死了
: 那些都是 scipy.org 的子项目. 我说"scipy下面"那一坨就指它们.
: 我在说ecosystem, 你在说这个ecosystem 下面具体的出场人物.
: 就像我说人要摄取蛋白质得吃肉
: 你非说谁吃肉啊, 我们都吃板鸭和龙虾...

l*y
发帖数: 21010
24
问题是你的job security是以牺牲自己的休息时间和精神健康为代价的

【在 a*f 的大作中提到】
: 别人的烂系统=我们的job security
: 系统越多问题才好

a*f
发帖数: 1790
25
看来你的位置不是重新开发系统,只能维护烂系统,当然最好跑路;我们这里开发人员
一般没有on call,40小时工作外OT要层层批准。

【在 l*y 的大作中提到】
: 问题是你的job security是以牺牲自己的休息时间和精神健康为代价的
J****R
发帖数: 373
26
很难啊。没点数学基础,做深了以后,连tm各种公式都看不懂,如何去调model。。。
。。
这东西学物理和数学的倒是比较适合。做应用程序的搞这个还是有点难度的。当然你要
是只想写这方面的code,那是another story。

【在 l*y 的大作中提到】
: 问题是你的job security是以牺牲自己的休息时间和精神健康为代价的
f****b
发帖数: 2410
27
re
l*y
发帖数: 21010
28
【 以下文字转载自 JobHunting 讨论区 】
发信人: ldy (大才001), 信区: JobHunting
标 题: Java码农转data science行业,有没有一起的
发信站: BBS 未名空间站 (Wed Mar 2 23:20:18 2016, 美东)
实在受不了无尽的production issue救火,on call。
学习各种层出不穷的framework,无非就是去适应某些人提出来的做事方式而已,研究
各种API轮子怎么用,整天忙于解决一些很琐碎无聊的问题。不断地加班,无尽的
crunch time,没有work life balance。
当初上学时候学的算法、数学完全派不上用场,感觉整个人变得消沉、无趣。
data science行业是一盏明灯,是我觉得唯一一个结合了数学和编程的需求较大的职业
方向。我昨天辞掉了我芝加哥年薪10万的java developer工作,开始全心全意转行学统
计、学r、学ETL,开始转行之路!
n******7
发帖数: 12463
29
能不学R就不要学R
我计划用scala或者python代替R
l*********s
发帖数: 5409
30
job security, man. :-(
相关主题
vert.x就是脚本语言们的企业版求python大牛指路
python is comingAnaconda装起来会跟已有的python dist有什么冲突吗?
pandas 作者:Apache Arrow and the "10 Things I Hate About pandas"易写性,易维护和执行效率综合来看
进入Programming版参与讨论
w********m
发帖数: 1137
31
挖的坑一点技术含量都没有
java有啥层出不穷的framework?
l*y
发帖数: 21010
32
前端

【在 w********m 的大作中提到】
: 挖的坑一点技术含量都没有
: java有啥层出不穷的framework?

r***y
发帖数: 4379
33
跳坑...
web前端是 JS 的世界不是一天两天了, Java 只是在后缩.
data science 也不是短时间能上手的, 整天琢磨数据咋用不喜好也不是啥轻省活.
码工背景上大蟒比R那一坨... 要来的灵活清爽吧
l*y
发帖数: 21010
34
python当然好弄,但R和SAS也都需要熟悉一下

【在 r***y 的大作中提到】
: 跳坑...
: web前端是 JS 的世界不是一天两天了, Java 只是在后缩.
: data science 也不是短时间能上手的, 整天琢磨数据咋用不喜好也不是啥轻省活.
: 码工背景上大蟒比R那一坨... 要来的灵活清爽吧

r***y
发帖数: 4379
35
python ecosystem 下面一坨一坨的也要堆时间的, 光scipy下面就够忙活一阵.
SAS 快让R和Python整的没活路了. 码工背景你弄SAS 干啥, 那都是给不太能码的统计
背景的人用的.

【在 l*y 的大作中提到】
: python当然好弄,但R和SAS也都需要熟悉一下
l*y
发帖数: 21010
36
你说的是没错。不过就是打算随手用用SAS,也没想太钻研。

【在 r***y 的大作中提到】
: python ecosystem 下面一坨一坨的也要堆时间的, 光scipy下面就够忙活一阵.
: SAS 快让R和Python整的没活路了. 码工背景你弄SAS 干啥, 那都是给不太能码的统计
: 背景的人用的.

n*****3
发帖数: 1584
37
for python, I think most of the time, use pandas/sicl-learn, who
needs numpy/scipy?

【在 r***y 的大作中提到】
: python ecosystem 下面一坨一坨的也要堆时间的, 光scipy下面就够忙活一阵.
: SAS 快让R和Python整的没活路了. 码工背景你弄SAS 干啥, 那都是给不太能码的统计
: 背景的人用的.

n******7
发帖数: 12463
38
统计的东西主要中scipy下面
numpy是这些的基础

【在 n*****3 的大作中提到】
: for python, I think most of the time, use pandas/sicl-learn, who
: needs numpy/scipy?

r***y
发帖数: 4379
39
你说的就是一个东西, 连scipy包括啥都没搞清楚

【在 n*****3 的大作中提到】
: for python, I think most of the time, use pandas/sicl-learn, who
: needs numpy/scipy?

w********m
发帖数: 1137
40
奇怪R为什么没有hash table。
这个丢很多分。
相关主题
易写性,易维护和执行效率综合来看dataframe和SQL最大区别是什么呢
python在2009年差点死掉,后来为什么起死回生了?有人上Spark用python API的么
data.table谁用过? 有那么神吗?大侠们说说C(C++)或Fortran比较Matlab到底优点在哪儿?
进入Programming版参与讨论
n******7
发帖数: 12463
41
用list凑合吧
R本来就只是个统计计算环境,最初是splus的开源实现
R的正确用法是先用别的语言搞定一切,R做个分析,完事

【在 w********m 的大作中提到】
: 奇怪R为什么没有hash table。
: 这个丢很多分。

x***4
发帖数: 1815
42
传统统计用r,ml用python,算法定下来要推到big data再换scala

【在 n******7 的大作中提到】
: 能不学R就不要学R
: 我计划用scala或者python代替R

a*f
发帖数: 1790
43
再好的工具也可以做出很烂的系统
做得好的系统几个月可以一个ticket都没有

【在 l*y 的大作中提到】
: 你说的是没错。不过就是打算随手用用SAS,也没想太钻研。
n*****3
发帖数: 1584
44
they are not!
pandas is copy cat of R dataframe/plyr.....
numpy/scipy are more like matlab, array/matrix based....
I do NOT think many DS guys like to use numpy or scipy directly now.

【在 r***y 的大作中提到】
: 你说的就是一个东西, 连scipy包括啥都没搞清楚
G****e
发帖数: 293
45
咱没有马工背景和脑子,有一定的统计基础。
现在每天在做的基本就是tableau,excel和spss
我个人准备走的路子是
先过了SAS的初级和高级,甭管有用没用,证书先拿着。
然后推R和python,如果能再懂点JS就更美好了。
总之就是打擦边球:
比纯数据库的或者马工懂统计原理
比纯统计的懂前端
当然最后可能两边不讨好,啥都会点,啥都不精。。。
l*y
发帖数: 21010
46
问题就是大部分公司系统都烂。这是事实。所以从概率上讲,你应该假定下一份工作的
系统还是烂。

【在 a*f 的大作中提到】
: 再好的工具也可以做出很烂的系统
: 做得好的系统几个月可以一个ticket都没有

r***y
发帖数: 4379
47
我晕死了
那些都是 scipy.org 的子项目. 我说"scipy下面"那一坨就指它们.
我在说ecosystem, 你在说这个ecosystem 下面具体的出场人物.
就像我说人要摄取蛋白质得吃肉
你非说谁吃肉啊, 我们都吃板鸭和龙虾...

【在 n*****3 的大作中提到】
: they are not!
: pandas is copy cat of R dataframe/plyr.....
: numpy/scipy are more like matlab, array/matrix based....
: I do NOT think many DS guys like to use numpy or scipy directly now.

a*f
发帖数: 1790
48
别人的烂系统=我们的job security
系统越多问题才好

【在 l*y 的大作中提到】
: 问题就是大部分公司系统都烂。这是事实。所以从概率上讲,你应该假定下一份工作的
: 系统还是烂。

n******7
发帖数: 12463
49
那你定位的工作是什么样的?
我有类似的想法
但是感觉现在社会分工很细
这种蝙蝠类的不能独挡一面,似乎机会不多阿

【在 G****e 的大作中提到】
: 咱没有马工背景和脑子,有一定的统计基础。
: 现在每天在做的基本就是tableau,excel和spss
: 我个人准备走的路子是
: 先过了SAS的初级和高级,甭管有用没用,证书先拿着。
: 然后推R和python,如果能再懂点JS就更美好了。
: 总之就是打擦边球:
: 比纯数据库的或者马工懂统计原理
: 比纯统计的懂前端
: 当然最后可能两边不讨好,啥都会点,啥都不精。。。

n*****3
发帖数: 1584
50
they are more like pydata now..

【在 r***y 的大作中提到】
: 我晕死了
: 那些都是 scipy.org 的子项目. 我说"scipy下面"那一坨就指它们.
: 我在说ecosystem, 你在说这个ecosystem 下面具体的出场人物.
: 就像我说人要摄取蛋白质得吃肉
: 你非说谁吃肉啊, 我们都吃板鸭和龙虾...

相关主题
Python的问题[合集] Python下面如何进行numeric analysis and statistical analysis
请教python中如何向文件写入矩阵有matplotlib或numpy/scipy的同学帮我试试
[合集] scipy还是matlab也谈谈语言之争
进入Programming版参与讨论
l*y
发帖数: 21010
51
问题是你的job security是以牺牲自己的休息时间和精神健康为代价的

【在 a*f 的大作中提到】
: 别人的烂系统=我们的job security
: 系统越多问题才好

a*f
发帖数: 1790
52
看来你的位置不是重新开发系统,只能维护烂系统,当然最好跑路;我们这里开发人员
一般没有on call,40小时工作外OT要层层批准。

【在 l*y 的大作中提到】
: 问题是你的job security是以牺牲自己的休息时间和精神健康为代价的
J****R
发帖数: 373
53
很难啊。没点数学基础,做深了以后,连tm各种公式都看不懂,如何去调model。。。
。。
这东西学物理和数学的倒是比较适合。做应用程序的搞这个还是有点难度的。当然你要
是只想写这方面的code,那是another story。

【在 l*y 的大作中提到】
: 问题是你的job security是以牺牲自己的休息时间和精神健康为代价的
f****b
发帖数: 2410
54
re
r***y
发帖数: 4379
55
不能同意更多

【在 J****R 的大作中提到】
: 很难啊。没点数学基础,做深了以后,连tm各种公式都看不懂,如何去调model。。。
: 。。
: 这东西学物理和数学的倒是比较适合。做应用程序的搞这个还是有点难度的。当然你要
: 是只想写这方面的code,那是another story。

1 (共1页)
进入Programming版参与讨论
相关主题
SciPy and NumPypython在2009年差点死掉,后来为什么起死回生了?
python3还是python?data.table谁用过? 有那么神吗?
vert.x就是脚本语言们的企业版dataframe和SQL最大区别是什么呢
python is coming有人上Spark用python API的么
pandas 作者:Apache Arrow and the "10 Things I Hate About pandas"大侠们说说C(C++)或Fortran比较Matlab到底优点在哪儿?
求python大牛指路Python的问题
Anaconda装起来会跟已有的python dist有什么冲突吗?请教python中如何向文件写入矩阵
易写性,易维护和执行效率综合来看[合集] scipy还是matlab
相关话题的讨论汇总
话题: scipy话题: python话题: sas话题: java话题: numpy