l*y 发帖数: 21010 | 1 【 以下文字转载自 JobHunting 讨论区 】
发信人: ldy (大才001), 信区: JobHunting
标 题: Java码农转data science行业,有没有一起的
发信站: BBS 未名空间站 (Wed Mar 2 23:20:18 2016, 美东)
实在受不了无尽的production issue救火,on call。
学习各种层出不穷的framework,无非就是去适应某些人提出来的做事方式而已,研究
各种API轮子怎么用,整天忙于解决一些很琐碎无聊的问题。不断地加班,无尽的
crunch time,没有work life balance。
当初上学时候学的算法、数学完全派不上用场,感觉整个人变得消沉、无趣。
data science行业是一盏明灯,是我觉得唯一一个结合了数学和编程的需求较大的职业
方向。我昨天辞掉了我芝加哥年薪10万的java developer工作,开始全心全意转行学统
计、学r、学ETL,开始转行之路! |
n******7 发帖数: 12463 | 2 能不学R就不要学R
我计划用scala或者python代替R |
l*********s 发帖数: 5409 | |
w********m 发帖数: 1137 | 4 挖的坑一点技术含量都没有
java有啥层出不穷的framework? |
l*y 发帖数: 21010 | 5 前端
【在 w********m 的大作中提到】 : 挖的坑一点技术含量都没有 : java有啥层出不穷的framework?
|
r***y 发帖数: 4379 | 6 跳坑...
web前端是 JS 的世界不是一天两天了, Java 只是在后缩.
data science 也不是短时间能上手的, 整天琢磨数据咋用不喜好也不是啥轻省活.
码工背景上大蟒比R那一坨... 要来的灵活清爽吧 |
l*y 发帖数: 21010 | 7 python当然好弄,但R和SAS也都需要熟悉一下
【在 r***y 的大作中提到】 : 跳坑... : web前端是 JS 的世界不是一天两天了, Java 只是在后缩. : data science 也不是短时间能上手的, 整天琢磨数据咋用不喜好也不是啥轻省活. : 码工背景上大蟒比R那一坨... 要来的灵活清爽吧
|
r***y 发帖数: 4379 | 8 python ecosystem 下面一坨一坨的也要堆时间的, 光scipy下面就够忙活一阵.
SAS 快让R和Python整的没活路了. 码工背景你弄SAS 干啥, 那都是给不太能码的统计
背景的人用的.
【在 l*y 的大作中提到】 : python当然好弄,但R和SAS也都需要熟悉一下
|
l*y 发帖数: 21010 | 9 你说的是没错。不过就是打算随手用用SAS,也没想太钻研。
【在 r***y 的大作中提到】 : python ecosystem 下面一坨一坨的也要堆时间的, 光scipy下面就够忙活一阵. : SAS 快让R和Python整的没活路了. 码工背景你弄SAS 干啥, 那都是给不太能码的统计 : 背景的人用的.
|
n*****3 发帖数: 1584 | 10 for python, I think most of the time, use pandas/sicl-learn, who
needs numpy/scipy?
【在 r***y 的大作中提到】 : python ecosystem 下面一坨一坨的也要堆时间的, 光scipy下面就够忙活一阵. : SAS 快让R和Python整的没活路了. 码工背景你弄SAS 干啥, 那都是给不太能码的统计 : 背景的人用的.
|
|
|
n******7 发帖数: 12463 | 11 统计的东西主要中scipy下面
numpy是这些的基础
【在 n*****3 的大作中提到】 : for python, I think most of the time, use pandas/sicl-learn, who : needs numpy/scipy?
|
r***y 发帖数: 4379 | 12 你说的就是一个东西, 连scipy包括啥都没搞清楚
【在 n*****3 的大作中提到】 : for python, I think most of the time, use pandas/sicl-learn, who : needs numpy/scipy?
|
w********m 发帖数: 1137 | 13 奇怪R为什么没有hash table。
这个丢很多分。 |
n******7 发帖数: 12463 | 14 用list凑合吧
R本来就只是个统计计算环境,最初是splus的开源实现
R的正确用法是先用别的语言搞定一切,R做个分析,完事
【在 w********m 的大作中提到】 : 奇怪R为什么没有hash table。 : 这个丢很多分。
|
x***4 发帖数: 1815 | 15 传统统计用r,ml用python,算法定下来要推到big data再换scala
【在 n******7 的大作中提到】 : 能不学R就不要学R : 我计划用scala或者python代替R
|
a*f 发帖数: 1790 | 16 再好的工具也可以做出很烂的系统
做得好的系统几个月可以一个ticket都没有
【在 l*y 的大作中提到】 : 你说的是没错。不过就是打算随手用用SAS,也没想太钻研。
|
n*****3 发帖数: 1584 | 17 they are not!
pandas is copy cat of R dataframe/plyr.....
numpy/scipy are more like matlab, array/matrix based....
I do NOT think many DS guys like to use numpy or scipy directly now.
【在 r***y 的大作中提到】 : 你说的就是一个东西, 连scipy包括啥都没搞清楚
|
G****e 发帖数: 293 | 18 咱没有马工背景和脑子,有一定的统计基础。
现在每天在做的基本就是tableau,excel和spss
我个人准备走的路子是
先过了SAS的初级和高级,甭管有用没用,证书先拿着。
然后推R和python,如果能再懂点JS就更美好了。
总之就是打擦边球:
比纯数据库的或者马工懂统计原理
比纯统计的懂前端
当然最后可能两边不讨好,啥都会点,啥都不精。。。 |
l*y 发帖数: 21010 | 19 问题就是大部分公司系统都烂。这是事实。所以从概率上讲,你应该假定下一份工作的
系统还是烂。
【在 a*f 的大作中提到】 : 再好的工具也可以做出很烂的系统 : 做得好的系统几个月可以一个ticket都没有
|
r***y 发帖数: 4379 | 20 我晕死了
那些都是 scipy.org 的子项目. 我说"scipy下面"那一坨就指它们.
我在说ecosystem, 你在说这个ecosystem 下面具体的出场人物.
就像我说人要摄取蛋白质得吃肉
你非说谁吃肉啊, 我们都吃板鸭和龙虾...
【在 n*****3 的大作中提到】 : they are not! : pandas is copy cat of R dataframe/plyr..... : numpy/scipy are more like matlab, array/matrix based.... : I do NOT think many DS guys like to use numpy or scipy directly now.
|
|
|
a*f 发帖数: 1790 | 21 别人的烂系统=我们的job security
系统越多问题才好
【在 l*y 的大作中提到】 : 问题就是大部分公司系统都烂。这是事实。所以从概率上讲,你应该假定下一份工作的 : 系统还是烂。
|
n******7 发帖数: 12463 | 22 那你定位的工作是什么样的?
我有类似的想法
但是感觉现在社会分工很细
这种蝙蝠类的不能独挡一面,似乎机会不多阿
【在 G****e 的大作中提到】 : 咱没有马工背景和脑子,有一定的统计基础。 : 现在每天在做的基本就是tableau,excel和spss : 我个人准备走的路子是 : 先过了SAS的初级和高级,甭管有用没用,证书先拿着。 : 然后推R和python,如果能再懂点JS就更美好了。 : 总之就是打擦边球: : 比纯数据库的或者马工懂统计原理 : 比纯统计的懂前端 : 当然最后可能两边不讨好,啥都会点,啥都不精。。。
|
n*****3 发帖数: 1584 | 23 they are more like pydata now..
【在 r***y 的大作中提到】 : 我晕死了 : 那些都是 scipy.org 的子项目. 我说"scipy下面"那一坨就指它们. : 我在说ecosystem, 你在说这个ecosystem 下面具体的出场人物. : 就像我说人要摄取蛋白质得吃肉 : 你非说谁吃肉啊, 我们都吃板鸭和龙虾...
|
l*y 发帖数: 21010 | 24 问题是你的job security是以牺牲自己的休息时间和精神健康为代价的
【在 a*f 的大作中提到】 : 别人的烂系统=我们的job security : 系统越多问题才好
|
a*f 发帖数: 1790 | 25 看来你的位置不是重新开发系统,只能维护烂系统,当然最好跑路;我们这里开发人员
一般没有on call,40小时工作外OT要层层批准。
【在 l*y 的大作中提到】 : 问题是你的job security是以牺牲自己的休息时间和精神健康为代价的
|
J****R 发帖数: 373 | 26 很难啊。没点数学基础,做深了以后,连tm各种公式都看不懂,如何去调model。。。
。。
这东西学物理和数学的倒是比较适合。做应用程序的搞这个还是有点难度的。当然你要
是只想写这方面的code,那是another story。
【在 l*y 的大作中提到】 : 问题是你的job security是以牺牲自己的休息时间和精神健康为代价的
|
f****b 发帖数: 2410 | |
l*y 发帖数: 21010 | 28 【 以下文字转载自 JobHunting 讨论区 】
发信人: ldy (大才001), 信区: JobHunting
标 题: Java码农转data science行业,有没有一起的
发信站: BBS 未名空间站 (Wed Mar 2 23:20:18 2016, 美东)
实在受不了无尽的production issue救火,on call。
学习各种层出不穷的framework,无非就是去适应某些人提出来的做事方式而已,研究
各种API轮子怎么用,整天忙于解决一些很琐碎无聊的问题。不断地加班,无尽的
crunch time,没有work life balance。
当初上学时候学的算法、数学完全派不上用场,感觉整个人变得消沉、无趣。
data science行业是一盏明灯,是我觉得唯一一个结合了数学和编程的需求较大的职业
方向。我昨天辞掉了我芝加哥年薪10万的java developer工作,开始全心全意转行学统
计、学r、学ETL,开始转行之路! |
n******7 发帖数: 12463 | 29 能不学R就不要学R
我计划用scala或者python代替R |
l*********s 发帖数: 5409 | |
|
|
w********m 发帖数: 1137 | 31 挖的坑一点技术含量都没有
java有啥层出不穷的framework? |
l*y 发帖数: 21010 | 32 前端
【在 w********m 的大作中提到】 : 挖的坑一点技术含量都没有 : java有啥层出不穷的framework?
|
r***y 发帖数: 4379 | 33 跳坑...
web前端是 JS 的世界不是一天两天了, Java 只是在后缩.
data science 也不是短时间能上手的, 整天琢磨数据咋用不喜好也不是啥轻省活.
码工背景上大蟒比R那一坨... 要来的灵活清爽吧 |
l*y 发帖数: 21010 | 34 python当然好弄,但R和SAS也都需要熟悉一下
【在 r***y 的大作中提到】 : 跳坑... : web前端是 JS 的世界不是一天两天了, Java 只是在后缩. : data science 也不是短时间能上手的, 整天琢磨数据咋用不喜好也不是啥轻省活. : 码工背景上大蟒比R那一坨... 要来的灵活清爽吧
|
r***y 发帖数: 4379 | 35 python ecosystem 下面一坨一坨的也要堆时间的, 光scipy下面就够忙活一阵.
SAS 快让R和Python整的没活路了. 码工背景你弄SAS 干啥, 那都是给不太能码的统计
背景的人用的.
【在 l*y 的大作中提到】 : python当然好弄,但R和SAS也都需要熟悉一下
|
l*y 发帖数: 21010 | 36 你说的是没错。不过就是打算随手用用SAS,也没想太钻研。
【在 r***y 的大作中提到】 : python ecosystem 下面一坨一坨的也要堆时间的, 光scipy下面就够忙活一阵. : SAS 快让R和Python整的没活路了. 码工背景你弄SAS 干啥, 那都是给不太能码的统计 : 背景的人用的.
|
n*****3 发帖数: 1584 | 37 for python, I think most of the time, use pandas/sicl-learn, who
needs numpy/scipy?
【在 r***y 的大作中提到】 : python ecosystem 下面一坨一坨的也要堆时间的, 光scipy下面就够忙活一阵. : SAS 快让R和Python整的没活路了. 码工背景你弄SAS 干啥, 那都是给不太能码的统计 : 背景的人用的.
|
n******7 发帖数: 12463 | 38 统计的东西主要中scipy下面
numpy是这些的基础
【在 n*****3 的大作中提到】 : for python, I think most of the time, use pandas/sicl-learn, who : needs numpy/scipy?
|
r***y 发帖数: 4379 | 39 你说的就是一个东西, 连scipy包括啥都没搞清楚
【在 n*****3 的大作中提到】 : for python, I think most of the time, use pandas/sicl-learn, who : needs numpy/scipy?
|
w********m 发帖数: 1137 | 40 奇怪R为什么没有hash table。
这个丢很多分。 |
|
|
n******7 发帖数: 12463 | 41 用list凑合吧
R本来就只是个统计计算环境,最初是splus的开源实现
R的正确用法是先用别的语言搞定一切,R做个分析,完事
【在 w********m 的大作中提到】 : 奇怪R为什么没有hash table。 : 这个丢很多分。
|
x***4 发帖数: 1815 | 42 传统统计用r,ml用python,算法定下来要推到big data再换scala
【在 n******7 的大作中提到】 : 能不学R就不要学R : 我计划用scala或者python代替R
|
a*f 发帖数: 1790 | 43 再好的工具也可以做出很烂的系统
做得好的系统几个月可以一个ticket都没有
【在 l*y 的大作中提到】 : 你说的是没错。不过就是打算随手用用SAS,也没想太钻研。
|
n*****3 发帖数: 1584 | 44 they are not!
pandas is copy cat of R dataframe/plyr.....
numpy/scipy are more like matlab, array/matrix based....
I do NOT think many DS guys like to use numpy or scipy directly now.
【在 r***y 的大作中提到】 : 你说的就是一个东西, 连scipy包括啥都没搞清楚
|
G****e 发帖数: 293 | 45 咱没有马工背景和脑子,有一定的统计基础。
现在每天在做的基本就是tableau,excel和spss
我个人准备走的路子是
先过了SAS的初级和高级,甭管有用没用,证书先拿着。
然后推R和python,如果能再懂点JS就更美好了。
总之就是打擦边球:
比纯数据库的或者马工懂统计原理
比纯统计的懂前端
当然最后可能两边不讨好,啥都会点,啥都不精。。。 |
l*y 发帖数: 21010 | 46 问题就是大部分公司系统都烂。这是事实。所以从概率上讲,你应该假定下一份工作的
系统还是烂。
【在 a*f 的大作中提到】 : 再好的工具也可以做出很烂的系统 : 做得好的系统几个月可以一个ticket都没有
|
r***y 发帖数: 4379 | 47 我晕死了
那些都是 scipy.org 的子项目. 我说"scipy下面"那一坨就指它们.
我在说ecosystem, 你在说这个ecosystem 下面具体的出场人物.
就像我说人要摄取蛋白质得吃肉
你非说谁吃肉啊, 我们都吃板鸭和龙虾...
【在 n*****3 的大作中提到】 : they are not! : pandas is copy cat of R dataframe/plyr..... : numpy/scipy are more like matlab, array/matrix based.... : I do NOT think many DS guys like to use numpy or scipy directly now.
|
a*f 发帖数: 1790 | 48 别人的烂系统=我们的job security
系统越多问题才好
【在 l*y 的大作中提到】 : 问题就是大部分公司系统都烂。这是事实。所以从概率上讲,你应该假定下一份工作的 : 系统还是烂。
|
n******7 发帖数: 12463 | 49 那你定位的工作是什么样的?
我有类似的想法
但是感觉现在社会分工很细
这种蝙蝠类的不能独挡一面,似乎机会不多阿
【在 G****e 的大作中提到】 : 咱没有马工背景和脑子,有一定的统计基础。 : 现在每天在做的基本就是tableau,excel和spss : 我个人准备走的路子是 : 先过了SAS的初级和高级,甭管有用没用,证书先拿着。 : 然后推R和python,如果能再懂点JS就更美好了。 : 总之就是打擦边球: : 比纯数据库的或者马工懂统计原理 : 比纯统计的懂前端 : 当然最后可能两边不讨好,啥都会点,啥都不精。。。
|
n*****3 发帖数: 1584 | 50 they are more like pydata now..
【在 r***y 的大作中提到】 : 我晕死了 : 那些都是 scipy.org 的子项目. 我说"scipy下面"那一坨就指它们. : 我在说ecosystem, 你在说这个ecosystem 下面具体的出场人物. : 就像我说人要摄取蛋白质得吃肉 : 你非说谁吃肉啊, 我们都吃板鸭和龙虾...
|
|
|
l*y 发帖数: 21010 | 51 问题是你的job security是以牺牲自己的休息时间和精神健康为代价的
【在 a*f 的大作中提到】 : 别人的烂系统=我们的job security : 系统越多问题才好
|
a*f 发帖数: 1790 | 52 看来你的位置不是重新开发系统,只能维护烂系统,当然最好跑路;我们这里开发人员
一般没有on call,40小时工作外OT要层层批准。
【在 l*y 的大作中提到】 : 问题是你的job security是以牺牲自己的休息时间和精神健康为代价的
|
J****R 发帖数: 373 | 53 很难啊。没点数学基础,做深了以后,连tm各种公式都看不懂,如何去调model。。。
。。
这东西学物理和数学的倒是比较适合。做应用程序的搞这个还是有点难度的。当然你要
是只想写这方面的code,那是another story。
【在 l*y 的大作中提到】 : 问题是你的job security是以牺牲自己的休息时间和精神健康为代价的
|
f****b 发帖数: 2410 | |
r***y 发帖数: 4379 | 55 不能同意更多
【在 J****R 的大作中提到】 : 很难啊。没点数学基础,做深了以后,连tm各种公式都看不懂,如何去调model。。。 : 。。 : 这东西学物理和数学的倒是比较适合。做应用程序的搞这个还是有点难度的。当然你要 : 是只想写这方面的code,那是another story。
|