b********1 发帖数: 291 | 1 看完你们的讨论 觉得大家忽视了一个实际问题: 随便一个什么数据, 选同样的
independent variable。 r跑出来的回归, 和sas跑出来的回归, 结果一样吗 ? 如
果不一样, 有多不一样? |
b********1 发帖数: 291 | 2 接下来的问题是, 如果系数完全一样, 那就选R. 如果不一样, vp就要想了, 我这
个model一用就是好几年, 每个月都要对上million的客户打分一次。 这个model也许
还会影响别的model,就算系数是.01不一样, 以后造成的影响也是巨大的。 亲爱的读
者们 如果你是vp, 你会选谁?
出个命题作文《vp的选择, sas or R 》, 你们往下写吧。 作为本版的2014年征文活
动。 |
l*****t 发帖数: 8319 | 3 多失败的vp需要考虑这样的问题。。。连老年经理都不会过问这些技术细节。。。。
【在 b********1 的大作中提到】 : 接下来的问题是, 如果系数完全一样, 那就选R. 如果不一样, vp就要想了, 我这 : 个model一用就是好几年, 每个月都要对上million的客户打分一次。 这个model也许 : 还会影响别的model,就算系数是.01不一样, 以后造成的影响也是巨大的。 亲爱的读 : 者们 如果你是vp, 你会选谁? : 出个命题作文《vp的选择, sas or R 》, 你们往下写吧。 作为本版的2014年征文活 : 动。
|
h***x 发帖数: 586 | 4 今晚没啥事,跑到indeed里面输入SAS programmer和R programmer做了个简单对比,比
较SAS programer Vs. R programmer工作的多少。分析不对的地方,大牛们勿见笑。
首先声明,结果有一定的bias,比方
1)只比较programmer这个级别。
2)SAS programmer搜索结果应该基本准确, R programmer出来的搜索结果会有一定的
假阳性,也就是说实际的数目要低一些,原因很简单,不多说了。
在National level 上,SAS programmer需求为1,305个,R programmer需求为367个,
index 为3.6,即SAS programer的需求是R programmer 需求的3.6倍。
统计了统计职位较多的13个州,其中SAS Programmer 有1,017个,占总数的78%,R
Programmer 有239个,占总数的65%。
以national为baseline,可以发现,请参考贴图
1)如果您在NJ/MA/PA/NC/CT/IL/FL等州,而且在用SAS的话,基本不需要担心什么,因
为相对于national水平,本州的SAS职位比R的职位要多的多。每个州都有自己的特点,
比如NJ药厂多deng.
2)如果您在DC/NY/GA/TX等地的话,可能需要考虑学习下R了,因为这些州里虽然现在
SAS的职位比R要多,但从长远看,如果R要替代SAS的话(don't know how long),这些
州比较重要。在这些州里,中小企业,特别是consulting firms非常多,对R的需求会
逐渐加大。
3)CA是个很特别的州,其index的值接近于national的值,主要原因是其在national比
重较大,所以我们在某种程度上是和CA在做比较.247 out of 1,305(18.9%) are SAS
programmer, and 66 out of 367 (18.0%) are for R programmer.需求差别不大。尽
管该州有最多的中小企业,和一些只用R的大公司(比方G),但该州也有很多大企业需
要SAS programmer.
总体来说SAS的工作在比较长的一段时间内还是会比R的工作多很多的。不同地域差
别很大,当然这是基于行业的关系。如果能结合行业的话,应能更准确的比较SAS和R的
需求趋势。当然,如果能加上时间比较,就更好了。 |
h***x 发帖数: 586 | 5 别说R和SAS比了,同样是SAS的产品,哪怕对10K obs+10个变量的数据跑简单的
stepwise, Proc logistic 和 Enterprise Miner产生的系数都不只差0.1。
不过这是小事,变量的方向对了就行。系数差个0.01不会改变rank. Rank最重要!
【在 b********1 的大作中提到】 : 接下来的问题是, 如果系数完全一样, 那就选R. 如果不一样, vp就要想了, 我这 : 个model一用就是好几年, 每个月都要对上million的客户打分一次。 这个model也许 : 还会影响别的model,就算系数是.01不一样, 以后造成的影响也是巨大的。 亲爱的读 : 者们 如果你是vp, 你会选谁? : 出个命题作文《vp的选择, sas or R 》, 你们往下写吧。 作为本版的2014年征文活 : 动。
|
d******e 发帖数: 7844 | 6 系数差个0.01就能产生巨大损失,说明估算的方法健壮性太差了。
【在 h***x 的大作中提到】 : 别说R和SAS比了,同样是SAS的产品,哪怕对10K obs+10个变量的数据跑简单的 : stepwise, Proc logistic 和 Enterprise Miner产生的系数都不只差0.1。 : 不过这是小事,变量的方向对了就行。系数差个0.01不会改变rank. Rank最重要!
|
m*******g 发帖数: 3044 | |
c***z 发帖数: 6348 | 8 I only care about career path... |
D******n 发帖数: 2836 | 9 Equation 里面有很多变量,对于不同公司,可能有所取舍。
刚刚以前同事才发来贺电,“在R里面做gains chart真他妈的容易".
对于小数据,在很多方面,R比SAS真的强很多。
【在 b********1 的大作中提到】 : 接下来的问题是, 如果系数完全一样, 那就选R. 如果不一样, vp就要想了, 我这 : 个model一用就是好几年, 每个月都要对上million的客户打分一次。 这个model也许 : 还会影响别的model,就算系数是.01不一样, 以后造成的影响也是巨大的。 亲爱的读 : 者们 如果你是vp, 你会选谁? : 出个命题作文《vp的选择, sas or R 》, 你们往下写吧。 作为本版的2014年征文活 : 动。
|
l*****t 发帖数: 8319 | 10 难道还能容易过knowledge studio。。。
【在 D******n 的大作中提到】 : Equation 里面有很多变量,对于不同公司,可能有所取舍。 : 刚刚以前同事才发来贺电,“在R里面做gains chart真他妈的容易". : 对于小数据,在很多方面,R比SAS真的强很多。
|
D******n 发帖数: 2836 | 11 R is free.
【在 l*****t 的大作中提到】 : 难道还能容易过knowledge studio。。。
|
P****D 发帖数: 11146 | 12 re这个。
【在 d******e 的大作中提到】 : 系数差个0.01就能产生巨大损失,说明估算的方法健壮性太差了。
|