f*********j 发帖数: 1955 | 1 不喜欢做SAS programmer?更喜欢做统计师?
怎么我更喜欢写code。。还是说自己太naive了,估计写多了,就会吐,会烦?发展受
限?其实希望自己一直写code,直接做好统计师要求的工作就好了。。好像很没有追求
的样子。。 |
w**p 发帖数: 4080 | 2 我喜欢编程,我是骄傲的码工。
代码在手,天下我有。 |
f*********j 发帖数: 1955 | 3 没有统计或生统的ms学位,是不是很难找到SAS programmer的工作啊?
【在 w**p 的大作中提到】 : 我喜欢编程,我是骄傲的码工。 : 代码在手,天下我有。
|
a***r 发帖数: 2677 | |
h***x 发帖数: 586 | 5 其实只coding挺没意思的,被别人呼来喝去的
【在 f*********j 的大作中提到】 : 不喜欢做SAS programmer?更喜欢做统计师? : 怎么我更喜欢写code。。还是说自己太naive了,估计写多了,就会吐,会烦?发展受 : 限?其实希望自己一直写code,直接做好统计师要求的工作就好了。。好像很没有追求 : 的样子。。
|
j****y 发帖数: 684 | 6 你这里说的是SAS的coding吧,
和CS的coding完全不是一回事。。。
【在 f*********j 的大作中提到】 : 不喜欢做SAS programmer?更喜欢做统计师? : 怎么我更喜欢写code。。还是说自己太naive了,估计写多了,就会吐,会烦?发展受 : 限?其实希望自己一直写code,直接做好统计师要求的工作就好了。。好像很没有追求 : 的样子。。
|
Z******a 发帖数: 1178 | 7 不会编程的其实就是智商低。你看会编程的男生为主,不喜欢编程的女生为主。
女生部喜欢编程其实就是能力不行表现。不喜欢只是借口。
你要说吃喝玩乐,大家都喜欢,编程很难。收入高。 |
a***r 发帖数: 2677 | 8 他说的是SAS编程,那个不难,工资高不起来。
【在 Z******a 的大作中提到】 : 不会编程的其实就是智商低。你看会编程的男生为主,不喜欢编程的女生为主。 : 女生部喜欢编程其实就是能力不行表现。不喜欢只是借口。 : 你要说吃喝玩乐,大家都喜欢,编程很难。收入高。
|
c****0 发帖数: 14490 | 9 同没追求~~o(>_<)o ~~
【在 f*********j 的大作中提到】 : 不喜欢做SAS programmer?更喜欢做统计师? : 怎么我更喜欢写code。。还是说自己太naive了,估计写多了,就会吐,会烦?发展受 : 限?其实希望自己一直写code,直接做好统计师要求的工作就好了。。好像很没有追求 : 的样子。。
|
t*****a 发帖数: 459 | 10 我也听说sas不算编程。不过就算sas编程对我来说都不容易。我觉得对于编程背景比较
薄弱的人来说,往编程方向发展就不划算了。我现在做的东西基本是自己整理数据自己
分析,但是我们这个领域(医药统计)一些工作,是programmer编程做了数据整理,然
后整理好的数据由statistician拿来分析。这种工作结构的话,感觉programmer也会比
较亏啊。 |
|
|
n****a 发帖数: 195 | 11 Like programming, not like data analysis -.- |
D******n 发帖数: 2836 | 12 由于不是医药领域的,一直很好奇,不写code的statistician是咋样的。
难道他们就click一下出个报告?
我觉得统计教育的最大误区就是不强调写code。很多analytics problem,大部分时间
是整理数据,
整理数据就是写code。可以说写code就是统计师的基本工作。
【在 t*****a 的大作中提到】 : 我也听说sas不算编程。不过就算sas编程对我来说都不容易。我觉得对于编程背景比较 : 薄弱的人来说,往编程方向发展就不划算了。我现在做的东西基本是自己整理数据自己 : 分析,但是我们这个领域(医药统计)一些工作,是programmer编程做了数据整理,然 : 后整理好的数据由statistician拿来分析。这种工作结构的话,感觉programmer也会比 : 较亏啊。
|
g*****o 发帖数: 812 | 13 做数据分析用的很多工具都是现成的吧, 平时学的是原理, 真的用的时候, 软件都可以
帮算
可能更原创更有探索性的工作才会要自己写算法
反正我觉得r啊, sas啊, matlab啊, 都是个大型计算器而已.
【在 D******n 的大作中提到】 : 由于不是医药领域的,一直很好奇,不写code的statistician是咋样的。 : 难道他们就click一下出个报告? : 我觉得统计教育的最大误区就是不强调写code。很多analytics problem,大部分时间 : 是整理数据, : 整理数据就是写code。可以说写code就是统计师的基本工作。
|
c***z 发帖数: 6348 | 14 无语了。
比如说现在有1PB的用户浏览记录,其中有些是产品页面,有些是checkout,有些是
shopping cart,怎么做:
1 popular items
2 paths to purchase
3 market share
4 sales prediction
5 recommender system
注意同一个产品在各网站的名称可能不同哦。
最重要的是,这些浏览记录不全,首先它只包括了一部分人,而且年轻人居多;其次就
连这一部分人的记录也不全。
【在 g*****o 的大作中提到】 : 做数据分析用的很多工具都是现成的吧, 平时学的是原理, 真的用的时候, 软件都可以 : 帮算 : 可能更原创更有探索性的工作才会要自己写算法 : 反正我觉得r啊, sas啊, matlab啊, 都是个大型计算器而已.
|
c***z 发帖数: 6348 | 15 显然你的追求不在统计,不过这也没什么
开心就好
【在 f*********j 的大作中提到】 : 不喜欢做SAS programmer?更喜欢做统计师? : 怎么我更喜欢写code。。还是说自己太naive了,估计写多了,就会吐,会烦?发展受 : 限?其实希望自己一直写code,直接做好统计师要求的工作就好了。。好像很没有追求 : 的样子。。
|
S******y 发帖数: 1123 | 16 Thanks for sharing the fun stuff you are working on!
Let me give a try by brainstorming :-)
At first, have a productID column so it allows one productID to have
multiple prod names across sites
1.-3. Pig summarizes data in Hadoop
4. Pig summarizes data in Hadoop ==> R/Python building models (quick and
dirty aggregate-level)
5. Mahout (item-based collaborative filtering)
Just my 2 cents :-)
statsGuy
m*********[email protected]
欢迎浏览Python/R/Hadoop实战速成课网页-
http://plus.google.com/+statsGuyMITBBS/about
【在 c***z 的大作中提到】 : 显然你的追求不在统计,不过这也没什么 : 开心就好
|
c***z 发帖数: 6348 | |
t*****a 发帖数: 459 | 18 这个可能医药领域是比较特殊。我的几个mentor都跟我说,如果想做统计,就尽量避免
programmer的工作。而且他们说,把统计人员当成programmer或data manager是对统计
的误解,因为这两个都可以和统计毫无关系的。但是小硕们的第一份工作有时候还是做
点data cleaning之类的,这类工作在我们那儿算是比较亏的,做一些长长见识可以,
但是时间长了就没意思了。很多生统类的比较好的工作都会要求会用某些软件,sas, r
之类的,但是会申明工作内容不包括具体编程。比较好的研究机构也会有专门的data
cleaning team,和统计不是一个组的。这并不是说programming 不好,而是我们本来
就不是作为programmer来发展的,往那个方向发展竞争力自然不如专业出身的。我的理
解,好的programmer应该对多种编程语言有融会贯通的理解,这个和统计不是一路的,
只是合作关系。
我现在的统计老板是phd, 会sas,不会r,负责总体设计, idea,结果检验和用sas进行
比较复杂的统计分析(就是非统计人员理解起来有困难,低级统计人员不能灵活运用的
那些个)。这个是我比较理想的职业方向,不过作为一个小硕,可能会有玻璃天花板。
【在 D******n 的大作中提到】 : 由于不是医药领域的,一直很好奇,不写code的statistician是咋样的。 : 难道他们就click一下出个报告? : 我觉得统计教育的最大误区就是不强调写code。很多analytics problem,大部分时间 : 是整理数据, : 整理数据就是写code。可以说写code就是统计师的基本工作。
|
a***r 发帖数: 2677 | 19 可能性极小。
r
【在 t*****a 的大作中提到】 : 这个可能医药领域是比较特殊。我的几个mentor都跟我说,如果想做统计,就尽量避免 : programmer的工作。而且他们说,把统计人员当成programmer或data manager是对统计 : 的误解,因为这两个都可以和统计毫无关系的。但是小硕们的第一份工作有时候还是做 : 点data cleaning之类的,这类工作在我们那儿算是比较亏的,做一些长长见识可以, : 但是时间长了就没意思了。很多生统类的比较好的工作都会要求会用某些软件,sas, r : 之类的,但是会申明工作内容不包括具体编程。比较好的研究机构也会有专门的data : cleaning team,和统计不是一个组的。这并不是说programming 不好,而是我们本来 : 就不是作为programmer来发展的,往那个方向发展竞争力自然不如专业出身的。我的理 : 解,好的programmer应该对多种编程语言有融会贯通的理解,这个和统计不是一路的, : 只是合作关系。
|
z****e 发帖数: 54598 | 20 不喜欢脚本罢了
脚本没啥搞头
sas和r和python什么都是脚本
跟真正现实中的建模不太一样 |
|
|
c*****a 发帖数: 808 | |
z****e 发帖数: 54598 | 22 怎么可能毫无关系
现在就是it公司提供了大量了data scientists机会
web search领域的各种新成果都是统计在搞
医药行业其实没啥正儿八经的programmers的
r
【在 t*****a 的大作中提到】 : 这个可能医药领域是比较特殊。我的几个mentor都跟我说,如果想做统计,就尽量避免 : programmer的工作。而且他们说,把统计人员当成programmer或data manager是对统计 : 的误解,因为这两个都可以和统计毫无关系的。但是小硕们的第一份工作有时候还是做 : 点data cleaning之类的,这类工作在我们那儿算是比较亏的,做一些长长见识可以, : 但是时间长了就没意思了。很多生统类的比较好的工作都会要求会用某些软件,sas, r : 之类的,但是会申明工作内容不包括具体编程。比较好的研究机构也会有专门的data : cleaning team,和统计不是一个组的。这并不是说programming 不好,而是我们本来 : 就不是作为programmer来发展的,往那个方向发展竞争力自然不如专业出身的。我的理 : 解,好的programmer应该对多种编程语言有融会贯通的理解,这个和统计不是一路的, : 只是合作关系。
|
a***r 发帖数: 2677 | 23 好像只有生统分成PHD毕业的统计师傅和MASTER毕业的CODER吧,别的行业里都是一个人
包了。可能当初质量高的毕业生少吧才这么搞。不像现在统计PHD大把大把的,还有巨
多科班的MASTER也想爬上去。
【在 z****e 的大作中提到】 : 怎么可能毫无关系 : 现在就是it公司提供了大量了data scientists机会 : web search领域的各种新成果都是统计在搞 : 医药行业其实没啥正儿八经的programmers的 : : r
|
t*****a 发帖数: 459 | 24 你说的很对。我说的只是根据前文讨论的医药和生统方面的情况。
【在 z****e 的大作中提到】 : 怎么可能毫无关系 : 现在就是it公司提供了大量了data scientists机会 : web search领域的各种新成果都是统计在搞 : 医药行业其实没啥正儿八经的programmers的 : : r
|
D******n 发帖数: 2836 | 25 把统计工作概括为programmer当然是误解,可是把这一部分完全分离开去才更是奇怪的
想法。
就好像一个艺术家,只出idea,不执笔去画画一样。
从data driven programming的角度,数据整理得好,基本就后面什么事情了。Data
structure trumps complated algorithsm
.
r
【在 t*****a 的大作中提到】 : 这个可能医药领域是比较特殊。我的几个mentor都跟我说,如果想做统计,就尽量避免 : programmer的工作。而且他们说,把统计人员当成programmer或data manager是对统计 : 的误解,因为这两个都可以和统计毫无关系的。但是小硕们的第一份工作有时候还是做 : 点data cleaning之类的,这类工作在我们那儿算是比较亏的,做一些长长见识可以, : 但是时间长了就没意思了。很多生统类的比较好的工作都会要求会用某些软件,sas, r : 之类的,但是会申明工作内容不包括具体编程。比较好的研究机构也会有专门的data : cleaning team,和统计不是一个组的。这并不是说programming 不好,而是我们本来 : 就不是作为programmer来发展的,往那个方向发展竞争力自然不如专业出身的。我的理 : 解,好的programmer应该对多种编程语言有融会贯通的理解,这个和统计不是一路的, : 只是合作关系。
|