c*******o 发帖数: 8869 | 1 【 以下文字转载自 Statistics 讨论区 】
发信人: comeandgo (春困秋乏夏打盹), 信区: Statistics
标 题: Re: SAS的前景可怕吗?
发信站: BBS 未名空间站 (Thu Apr 10 10:24:32 2014, 美东)
对open source也不能盲从, 下面这片paper对SAS/R的mixed model做了系统的比较,
结论是r的准确性比sas差很多
http://onlinelibrary.wiley.com/doi/10.1002/sim.4265/abstract
而且现在 doug bates也已经撂挑子不干了, 他的mixed model谁来维护呢? 如果一个
大公司的重要infrastructure严重依赖这些免费package, 潜在的威胁和成本如何考虑
呢?
openn SSL的教训也就是这几天的事情。 |
M****z 发帖数: 1058 | |
G**Y 发帖数: 33224 | 3 看了那边的讨论,有一点很正确,药厂这边的business SAS一时半会儿丢不了。SAS最
少10年内不会有问题。应用面可能会变窄。
我倒是希望SAS能兴旺发达。毕竟R的这种开发模式不适合搞大规模的东西。
R就是给糙快猛们准备的。很适合学术界拉经费。
【在 M****z 的大作中提到】 : 有人慌了,哈哈
|
i**i 发帖数: 1500 | 4 是这个结论吗?
open source的问题是门槛低,谁都可以用. 造成的结果是良莠不齐,不可靠.
R用好了牛着呢.
,
【在 c*******o 的大作中提到】 : 【 以下文字转载自 Statistics 讨论区 】 : 发信人: comeandgo (春困秋乏夏打盹), 信区: Statistics : 标 题: Re: SAS的前景可怕吗? : 发信站: BBS 未名空间站 (Thu Apr 10 10:24:32 2014, 美东) : 对open source也不能盲从, 下面这片paper对SAS/R的mixed model做了系统的比较, : 结论是r的准确性比sas差很多 : http://onlinelibrary.wiley.com/doi/10.1002/sim.4265/abstract : 而且现在 doug bates也已经撂挑子不干了, 他的mixed model谁来维护呢? 如果一个 : 大公司的重要infrastructure严重依赖这些免费package, 潜在的威胁和成本如何考虑 : 呢?
|
M****z 发帖数: 1058 | 5 contender matters, guys. |
d*******r 发帖数: 3299 | 6 看了下 统计版 ,很多人在讨论从 dog food (SAS) 转到 Python 和 R.
挺好玩的,呵呵 |
k*******n 发帖数: 190 | 7 SAS 是贵,可是处理的数据量大了,没有别的可以用. 要么就是自己在分布式系统上自己
编,prototype 还是要先用SAS做出来, R 早就CRASH了. |
d*******r 发帖数: 3299 | 8 看他们讨论说 R 的 lib 质量精度参差不齐,
所以我觉得还是统计的 open source community 不给力,让 SAS 这种恐龙还活得好好的
【在 k*******n 的大作中提到】 : SAS 是贵,可是处理的数据量大了,没有别的可以用. 要么就是自己在分布式系统上自己 : 编,prototype 还是要先用SAS做出来, R 早就CRASH了.
|
d********u 发帖数: 5383 | 9 关键os community也得懂点儿数学呀。你看他们那质量,lambda calculus都稀里糊涂
的。直接上markov chain还不立马就翘了?
马公就是小LABOR,没domain knowledge,只能去写JAVA什么的。
好的
【在 d*******r 的大作中提到】 : 看他们讨论说 R 的 lib 质量精度参差不齐, : 所以我觉得还是统计的 open source community 不给力,让 SAS 这种恐龙还活得好好的
|
G**Y 发帖数: 33224 | 10 不能这么讲呀。
SAS投入多少钱呀。R才多少钱呀。有人投资R也可以做出好东西呀。现在很多在R上的东
西就是个proof of concept。
好的
【在 d*******r 的大作中提到】 : 看他们讨论说 R 的 lib 质量精度参差不齐, : 所以我觉得还是统计的 open source community 不给力,让 SAS 这种恐龙还活得好好的
|
|
|
i**i 发帖数: 1500 | 11 不懂胡说.
【在 k*******n 的大作中提到】 : SAS 是贵,可是处理的数据量大了,没有别的可以用. 要么就是自己在分布式系统上自己 : 编,prototype 还是要先用SAS做出来, R 早就CRASH了.
|
M****z 发帖数: 1058 | 12 看着似乎大多国人吃统计饭的还没有看明白open source到底是怎么回事儿啊,呵呵 |
i**i 发帖数: 1500 | 13 open source的东西就这样.使用者自己的水平决定了什么东西可以用.
商业软件考虑使用者的群体,门槛高低 -- 挣得就是这份钱.
一般的开源的东西,凑凑活活就行了,经常是"你懂的","自己来".
开源的高质量的当然很多,但是让人心里没底的更多.
好的
【在 d*******r 的大作中提到】 : 看他们讨论说 R 的 lib 质量精度参差不齐, : 所以我觉得还是统计的 open source community 不给力,让 SAS 这种恐龙还活得好好的
|
c*******o 发帖数: 8869 | 14 关键是统计package质量差一点造成的后果不严重(大部分情况), 或者要用很长的的
时间才能看出后果, 比如准确的p value 0.000001, 质量差一点的package算出来0.
00001, 这样小的差别会死人吗? 所以不会有人对open source package的算法太较真
。open source放在那里谁都可以去检查, 但实际上谁也不会去检查。 open SSL
heartbleed据说也是个很低级的bug, 但是居然也没有人事先发现, 更何况是统计这样
impact小的多的东东。
在我看来统计软件根本就不适合open source community来搞, 本来就是很boring的东
西, 搞的再fancy也fancy不到那里去, geek要的是糙快猛, 不见得重视细节, 有个
恐龙公司专门做development/QC还让人放心一点。
好的
【在 d*******r 的大作中提到】 : 看他们讨论说 R 的 lib 质量精度参差不齐, : 所以我觉得还是统计的 open source community 不给力,让 SAS 这种恐龙还活得好好的
|
G**Y 发帖数: 33224 | 15 没有open source 哪来的R呀。R才15年左右吧,已经彻底改变了统计计算领域。(其实
比SAS还惨的是Splus呀。很多人不知道啥是SPlus了吧。)
至于精确度和科学发现,在于使用的人是不是good statisticians。
统计的问题是很难证实,但是可以证伪。统计可能没发现啥,但是能指出很多伪科学。
【在 c*******o 的大作中提到】 : 关键是统计package质量差一点造成的后果不严重(大部分情况), 或者要用很长的的 : 时间才能看出后果, 比如准确的p value 0.000001, 质量差一点的package算出来0. : 00001, 这样小的差别会死人吗? 所以不会有人对open source package的算法太较真 : 。open source放在那里谁都可以去检查, 但实际上谁也不会去检查。 open SSL : heartbleed据说也是个很低级的bug, 但是居然也没有人事先发现, 更何况是统计这样 : impact小的多的东东。 : 在我看来统计软件根本就不适合open source community来搞, 本来就是很boring的东 : 西, 搞的再fancy也fancy不到那里去, geek要的是糙快猛, 不见得重视细节, 有个 : 恐龙公司专门做development/QC还让人放心一点。 :
|
m********s 发帖数: 55301 | 16 在现实生活中,钱(预算)和自己个人的利益是决定如何选择产品的因素。
试问,只有10万一年的预算,你能用哪个产品?
再试问,你个人的职务需要为企业未来10年后的命运负责吗?
【在 c*******o 的大作中提到】 : 关键是统计package质量差一点造成的后果不严重(大部分情况), 或者要用很长的的 : 时间才能看出后果, 比如准确的p value 0.000001, 质量差一点的package算出来0. : 00001, 这样小的差别会死人吗? 所以不会有人对open source package的算法太较真 : 。open source放在那里谁都可以去检查, 但实际上谁也不会去检查。 open SSL : heartbleed据说也是个很低级的bug, 但是居然也没有人事先发现, 更何况是统计这样 : impact小的多的东东。 : 在我看来统计软件根本就不适合open source community来搞, 本来就是很boring的东 : 西, 搞的再fancy也fancy不到那里去, geek要的是糙快猛, 不见得重视细节, 有个 : 恐龙公司专门做development/QC还让人放心一点。 :
|
c*******o 发帖数: 8869 | 17 good statistician也得依赖软件的精度啊, 要不跑个简单的anova都要每次把sum of
square自己算一遍, 那还干不干别的了?
【在 G**Y 的大作中提到】 : 没有open source 哪来的R呀。R才15年左右吧,已经彻底改变了统计计算领域。(其实 : 比SAS还惨的是Splus呀。很多人不知道啥是SPlus了吧。) : 至于精确度和科学发现,在于使用的人是不是good statisticians。 : 统计的问题是很难证实,但是可以证伪。统计可能没发现啥,但是能指出很多伪科学。
|
G**Y 发帖数: 33224 | 18 谁告诉你R精度不够的。
of
【在 c*******o 的大作中提到】 : good statistician也得依赖软件的精度啊, 要不跑个简单的anova都要每次把sum of : square自己算一遍, 那还干不干别的了?
|
c*******o 发帖数: 8869 | 19 从statistician个人职业来说, 如果从头开始, 什么sas r 之类的都不该学, 就学
三样就够了: python, sql, javascript.
【在 m********s 的大作中提到】 : 在现实生活中,钱(预算)和自己个人的利益是决定如何选择产品的因素。 : 试问,只有10万一年的预算,你能用哪个产品? : 再试问,你个人的职务需要为企业未来10年后的命运负责吗?
|
c*******o 发帖数: 8869 | 20 看我第楼顶里引得那片文章。当然我相信R对于我这个水平的是足够精确了。
【在 G**Y 的大作中提到】 : 谁告诉你R精度不够的。 : : of
|
|
|
G**Y 发帖数: 33224 | 21 又误导大家把。我还很少看见用Python做统计的。JS就更不必说了,根本是另一个范畴
的东西。
【在 c*******o 的大作中提到】 : 从statistician个人职业来说, 如果从头开始, 什么sas r 之类的都不该学, 就学 : 三样就够了: python, sql, javascript.
|
c*******o 发帖数: 8869 | 22 python可是统计界新贵, 虽然在这个版被人鄙视。 但是python r sas学的再好也是给
人家打工的。 懂一点JS, SQL, 可以做统计web app, SaaS啥的, 自己开个公司当老板
, 哈哈
【在 G**Y 的大作中提到】 : 又误导大家把。我还很少看见用Python做统计的。JS就更不必说了,根本是另一个范畴 : 的东西。
|
d*******r 发帖数: 3299 | 23 恩,其实就是不理解。
只要SAS有竞争对手,而且是大公司,就可以雇一堆人搞好 R 的开源,
就像之前 Google 为首的公司用开源搞 M$ 这类闭源公司一样,那样 SAS 才真的会玩
完。
Open Source 里面厉害的东西多了,因为背后可能有各种大佬支持的, 再加上 CS 民间
高手确实也多。
【在 M****z 的大作中提到】 : 看着似乎大多国人吃统计饭的还没有看明白open source到底是怎么回事儿啊,呵呵
|
g*****g 发帖数: 34805 | 24 这话说的,不如说懂ppt可以做ceo。
【在 c*******o 的大作中提到】 : python可是统计界新贵, 虽然在这个版被人鄙视。 但是python r sas学的再好也是给 : 人家打工的。 懂一点JS, SQL, 可以做统计web app, SaaS啥的, 自己开个公司当老板 : , 哈哈
|
d****i 发帖数: 4809 | 25 他说的这几个都是码工的东西,和统计没有任何关系,原来我室友是统计的,就只会
SAS就足够了,而且现在是大银行的头目。
【在 G**Y 的大作中提到】 : 又误导大家把。我还很少看见用Python做统计的。JS就更不必说了,根本是另一个范畴 : 的东西。
|
i**i 发帖数: 1500 | 26 买买提有风险,看帖需谨慎。
【在 c*******o 的大作中提到】 : 从statistician个人职业来说, 如果从头开始, 什么sas r 之类的都不该学, 就学 : 三样就够了: python, sql, javascript.
|
c*******o 发帖数: 8869 | 27 和ppt不搭界。这年头,domain knowledge + analytics (也就是stat) + it
background, 一人身兼三项的话, 真的可以出来闯一闯了
★ 发自iPhone App: ChineseWeb 8.0.1
【在 g*****g 的大作中提到】 : 这话说的,不如说懂ppt可以做ceo。
|
n******7 发帖数: 12463 | 28 这说的,做生物信息的都可以出来闯了
【在 c*******o 的大作中提到】 : 和ppt不搭界。这年头,domain knowledge + analytics (也就是stat) + it : background, 一人身兼三项的话, 真的可以出来闯一闯了 : : ★ 发自iPhone App: ChineseWeb 8.0.1
|
M****z 发帖数: 1058 | 29 嗯。软件这东西除了技术以外,还有个如何玩转的理念。这点应该是开源上白人占主流
的原因之一吧。可能是我看得少,感觉那些比较有名的主要都是些老白搞的。
开源就是个contender的游戏,进入任何一个行业都会带来传统霸主市场份额的萎缩。
里面可以出现的可能性太多了。
【在 d*******r 的大作中提到】 : 恩,其实就是不理解。 : 只要SAS有竞争对手,而且是大公司,就可以雇一堆人搞好 R 的开源, : 就像之前 Google 为首的公司用开源搞 M$ 这类闭源公司一样,那样 SAS 才真的会玩 : 完。 : Open Source 里面厉害的东西多了,因为背后可能有各种大佬支持的, 再加上 CS 民间 : 高手确实也多。
|