由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - Re: SAS的前景可怕吗? (转载)
相关主题
还是别争了,从旁观者角度看,两个方案没准都能工作大家觉得C++还有生命力吗?
Help needed! LDAP Integration with hosted applications (转载)王开源:从诺顿误杀WinXP后门误猜国家机密 (转载)
我终于开源过了Qt/Windows 开源版本将支持 VS Express
ifanr:到底谁才是真正的隐形战友——开源软件和 OpenSSL 的真实故事(zz)SSL Session的问题
open source的开发者到底拿什么养活老婆孩子?哈哈
iOS开发有没有Java里的开源框架的概念?c# 3 很强大
如何有效 DEBUG 开源软件中的 BUG?Any Free 汉字识别的库?
会Python就可以当码工了?[合集] perl 下面 TLS/SSL IMAP module??
相关话题的讨论汇总
话题: sas话题: source话题: 统计话题: open话题: python
进入Programming版参与讨论
1 (共1页)
c*******o
发帖数: 8869
1
【 以下文字转载自 Statistics 讨论区 】
发信人: comeandgo (春困秋乏夏打盹), 信区: Statistics
标 题: Re: SAS的前景可怕吗?
发信站: BBS 未名空间站 (Thu Apr 10 10:24:32 2014, 美东)
对open source也不能盲从, 下面这片paper对SAS/R的mixed model做了系统的比较,
结论是r的准确性比sas差很多
http://onlinelibrary.wiley.com/doi/10.1002/sim.4265/abstract
而且现在 doug bates也已经撂挑子不干了, 他的mixed model谁来维护呢? 如果一个
大公司的重要infrastructure严重依赖这些免费package, 潜在的威胁和成本如何考虑
呢?
openn SSL的教训也就是这几天的事情。
M****z
发帖数: 1058
2
有人慌了,哈哈
G**Y
发帖数: 33224
3
看了那边的讨论,有一点很正确,药厂这边的business SAS一时半会儿丢不了。SAS最
少10年内不会有问题。应用面可能会变窄。
我倒是希望SAS能兴旺发达。毕竟R的这种开发模式不适合搞大规模的东西。
R就是给糙快猛们准备的。很适合学术界拉经费。

【在 M****z 的大作中提到】
: 有人慌了,哈哈
i**i
发帖数: 1500
4
是这个结论吗?
open source的问题是门槛低,谁都可以用. 造成的结果是良莠不齐,不可靠.
R用好了牛着呢.



【在 c*******o 的大作中提到】
: 【 以下文字转载自 Statistics 讨论区 】
: 发信人: comeandgo (春困秋乏夏打盹), 信区: Statistics
: 标 题: Re: SAS的前景可怕吗?
: 发信站: BBS 未名空间站 (Thu Apr 10 10:24:32 2014, 美东)
: 对open source也不能盲从, 下面这片paper对SAS/R的mixed model做了系统的比较,
: 结论是r的准确性比sas差很多
: http://onlinelibrary.wiley.com/doi/10.1002/sim.4265/abstract
: 而且现在 doug bates也已经撂挑子不干了, 他的mixed model谁来维护呢? 如果一个
: 大公司的重要infrastructure严重依赖这些免费package, 潜在的威胁和成本如何考虑
: 呢?

M****z
发帖数: 1058
5
contender matters, guys.
d*******r
发帖数: 3299
6
看了下 统计版 ,很多人在讨论从 dog food (SAS) 转到 Python 和 R.
挺好玩的,呵呵
k*******n
发帖数: 190
7
SAS 是贵,可是处理的数据量大了,没有别的可以用. 要么就是自己在分布式系统上自己
编,prototype 还是要先用SAS做出来, R 早就CRASH了.
d*******r
发帖数: 3299
8
看他们讨论说 R 的 lib 质量精度参差不齐,
所以我觉得还是统计的 open source community 不给力,让 SAS 这种恐龙还活得好好的

【在 k*******n 的大作中提到】
: SAS 是贵,可是处理的数据量大了,没有别的可以用. 要么就是自己在分布式系统上自己
: 编,prototype 还是要先用SAS做出来, R 早就CRASH了.

d********u
发帖数: 5383
9
关键os community也得懂点儿数学呀。你看他们那质量,lambda calculus都稀里糊涂
的。直接上markov chain还不立马就翘了?
马公就是小LABOR,没domain knowledge,只能去写JAVA什么的。

好的

【在 d*******r 的大作中提到】
: 看他们讨论说 R 的 lib 质量精度参差不齐,
: 所以我觉得还是统计的 open source community 不给力,让 SAS 这种恐龙还活得好好的

G**Y
发帖数: 33224
10
不能这么讲呀。
SAS投入多少钱呀。R才多少钱呀。有人投资R也可以做出好东西呀。现在很多在R上的东
西就是个proof of concept。

好的

【在 d*******r 的大作中提到】
: 看他们讨论说 R 的 lib 质量精度参差不齐,
: 所以我觉得还是统计的 open source community 不给力,让 SAS 这种恐龙还活得好好的

相关主题
iOS开发有没有Java里的开源框架的概念?大家觉得C++还有生命力吗?
如何有效 DEBUG 开源软件中的 BUG?王开源:从诺顿误杀WinXP后门误猜国家机密 (转载)
会Python就可以当码工了?Qt/Windows 开源版本将支持 VS Express
进入Programming版参与讨论
i**i
发帖数: 1500
11
不懂胡说.

【在 k*******n 的大作中提到】
: SAS 是贵,可是处理的数据量大了,没有别的可以用. 要么就是自己在分布式系统上自己
: 编,prototype 还是要先用SAS做出来, R 早就CRASH了.

M****z
发帖数: 1058
12
看着似乎大多国人吃统计饭的还没有看明白open source到底是怎么回事儿啊,呵呵
i**i
发帖数: 1500
13
open source的东西就这样.使用者自己的水平决定了什么东西可以用.
商业软件考虑使用者的群体,门槛高低 -- 挣得就是这份钱.
一般的开源的东西,凑凑活活就行了,经常是"你懂的","自己来".
开源的高质量的当然很多,但是让人心里没底的更多.

好的

【在 d*******r 的大作中提到】
: 看他们讨论说 R 的 lib 质量精度参差不齐,
: 所以我觉得还是统计的 open source community 不给力,让 SAS 这种恐龙还活得好好的

c*******o
发帖数: 8869
14
关键是统计package质量差一点造成的后果不严重(大部分情况), 或者要用很长的的
时间才能看出后果, 比如准确的p value 0.000001, 质量差一点的package算出来0.
00001, 这样小的差别会死人吗? 所以不会有人对open source package的算法太较真
。open source放在那里谁都可以去检查, 但实际上谁也不会去检查。 open SSL
heartbleed据说也是个很低级的bug, 但是居然也没有人事先发现, 更何况是统计这样
impact小的多的东东。
在我看来统计软件根本就不适合open source community来搞, 本来就是很boring的东
西, 搞的再fancy也fancy不到那里去, geek要的是糙快猛, 不见得重视细节, 有个
恐龙公司专门做development/QC还让人放心一点。

好的

【在 d*******r 的大作中提到】
: 看他们讨论说 R 的 lib 质量精度参差不齐,
: 所以我觉得还是统计的 open source community 不给力,让 SAS 这种恐龙还活得好好的

G**Y
发帖数: 33224
15
没有open source 哪来的R呀。R才15年左右吧,已经彻底改变了统计计算领域。(其实
比SAS还惨的是Splus呀。很多人不知道啥是SPlus了吧。)
至于精确度和科学发现,在于使用的人是不是good statisticians。
统计的问题是很难证实,但是可以证伪。统计可能没发现啥,但是能指出很多伪科学。

【在 c*******o 的大作中提到】
: 关键是统计package质量差一点造成的后果不严重(大部分情况), 或者要用很长的的
: 时间才能看出后果, 比如准确的p value 0.000001, 质量差一点的package算出来0.
: 00001, 这样小的差别会死人吗? 所以不会有人对open source package的算法太较真
: 。open source放在那里谁都可以去检查, 但实际上谁也不会去检查。 open SSL
: heartbleed据说也是个很低级的bug, 但是居然也没有人事先发现, 更何况是统计这样
: impact小的多的东东。
: 在我看来统计软件根本就不适合open source community来搞, 本来就是很boring的东
: 西, 搞的再fancy也fancy不到那里去, geek要的是糙快猛, 不见得重视细节, 有个
: 恐龙公司专门做development/QC还让人放心一点。
:

m********s
发帖数: 55301
16
在现实生活中,钱(预算)和自己个人的利益是决定如何选择产品的因素。
试问,只有10万一年的预算,你能用哪个产品?
再试问,你个人的职务需要为企业未来10年后的命运负责吗?

【在 c*******o 的大作中提到】
: 关键是统计package质量差一点造成的后果不严重(大部分情况), 或者要用很长的的
: 时间才能看出后果, 比如准确的p value 0.000001, 质量差一点的package算出来0.
: 00001, 这样小的差别会死人吗? 所以不会有人对open source package的算法太较真
: 。open source放在那里谁都可以去检查, 但实际上谁也不会去检查。 open SSL
: heartbleed据说也是个很低级的bug, 但是居然也没有人事先发现, 更何况是统计这样
: impact小的多的东东。
: 在我看来统计软件根本就不适合open source community来搞, 本来就是很boring的东
: 西, 搞的再fancy也fancy不到那里去, geek要的是糙快猛, 不见得重视细节, 有个
: 恐龙公司专门做development/QC还让人放心一点。
:

c*******o
发帖数: 8869
17
good statistician也得依赖软件的精度啊, 要不跑个简单的anova都要每次把sum of
square自己算一遍, 那还干不干别的了?

【在 G**Y 的大作中提到】
: 没有open source 哪来的R呀。R才15年左右吧,已经彻底改变了统计计算领域。(其实
: 比SAS还惨的是Splus呀。很多人不知道啥是SPlus了吧。)
: 至于精确度和科学发现,在于使用的人是不是good statisticians。
: 统计的问题是很难证实,但是可以证伪。统计可能没发现啥,但是能指出很多伪科学。

G**Y
发帖数: 33224
18
谁告诉你R精度不够的。

of

【在 c*******o 的大作中提到】
: good statistician也得依赖软件的精度啊, 要不跑个简单的anova都要每次把sum of
: square自己算一遍, 那还干不干别的了?

c*******o
发帖数: 8869
19
从statistician个人职业来说, 如果从头开始, 什么sas r 之类的都不该学, 就学
三样就够了: python, sql, javascript.

【在 m********s 的大作中提到】
: 在现实生活中,钱(预算)和自己个人的利益是决定如何选择产品的因素。
: 试问,只有10万一年的预算,你能用哪个产品?
: 再试问,你个人的职务需要为企业未来10年后的命运负责吗?

c*******o
发帖数: 8869
20
看我第楼顶里引得那片文章。当然我相信R对于我这个水平的是足够精确了。

【在 G**Y 的大作中提到】
: 谁告诉你R精度不够的。
:
: of

相关主题
SSL Session的问题Any Free 汉字识别的库?
哈哈[合集] perl 下面 TLS/SSL IMAP module??
c# 3 很强大这样的开源软件合作靠谱吗? (转载)
进入Programming版参与讨论
G**Y
发帖数: 33224
21
又误导大家把。我还很少看见用Python做统计的。JS就更不必说了,根本是另一个范畴
的东西。

【在 c*******o 的大作中提到】
: 从statistician个人职业来说, 如果从头开始, 什么sas r 之类的都不该学, 就学
: 三样就够了: python, sql, javascript.

c*******o
发帖数: 8869
22
python可是统计界新贵, 虽然在这个版被人鄙视。 但是python r sas学的再好也是给
人家打工的。 懂一点JS, SQL, 可以做统计web app, SaaS啥的, 自己开个公司当老板
, 哈哈

【在 G**Y 的大作中提到】
: 又误导大家把。我还很少看见用Python做统计的。JS就更不必说了,根本是另一个范畴
: 的东西。

d*******r
发帖数: 3299
23
恩,其实就是不理解。
只要SAS有竞争对手,而且是大公司,就可以雇一堆人搞好 R 的开源,
就像之前 Google 为首的公司用开源搞 M$ 这类闭源公司一样,那样 SAS 才真的会玩
完。
Open Source 里面厉害的东西多了,因为背后可能有各种大佬支持的, 再加上 CS 民间
高手确实也多。

【在 M****z 的大作中提到】
: 看着似乎大多国人吃统计饭的还没有看明白open source到底是怎么回事儿啊,呵呵
g*****g
发帖数: 34805
24
这话说的,不如说懂ppt可以做ceo。

【在 c*******o 的大作中提到】
: python可是统计界新贵, 虽然在这个版被人鄙视。 但是python r sas学的再好也是给
: 人家打工的。 懂一点JS, SQL, 可以做统计web app, SaaS啥的, 自己开个公司当老板
: , 哈哈

d****i
发帖数: 4809
25
他说的这几个都是码工的东西,和统计没有任何关系,原来我室友是统计的,就只会
SAS就足够了,而且现在是大银行的头目。

【在 G**Y 的大作中提到】
: 又误导大家把。我还很少看见用Python做统计的。JS就更不必说了,根本是另一个范畴
: 的东西。

i**i
发帖数: 1500
26
买买提有风险,看帖需谨慎。

【在 c*******o 的大作中提到】
: 从statistician个人职业来说, 如果从头开始, 什么sas r 之类的都不该学, 就学
: 三样就够了: python, sql, javascript.

c*******o
发帖数: 8869
27
和ppt不搭界。这年头,domain knowledge + analytics (也就是stat) + it
background, 一人身兼三项的话, 真的可以出来闯一闯了

★ 发自iPhone App: ChineseWeb 8.0.1

【在 g*****g 的大作中提到】
: 这话说的,不如说懂ppt可以做ceo。
n******7
发帖数: 12463
28
这说的,做生物信息的都可以出来闯了

【在 c*******o 的大作中提到】
: 和ppt不搭界。这年头,domain knowledge + analytics (也就是stat) + it
: background, 一人身兼三项的话, 真的可以出来闯一闯了
:
: ★ 发自iPhone App: ChineseWeb 8.0.1

M****z
发帖数: 1058
29
嗯。软件这东西除了技术以外,还有个如何玩转的理念。这点应该是开源上白人占主流
的原因之一吧。可能是我看得少,感觉那些比较有名的主要都是些老白搞的。
开源就是个contender的游戏,进入任何一个行业都会带来传统霸主市场份额的萎缩。
里面可以出现的可能性太多了。

【在 d*******r 的大作中提到】
: 恩,其实就是不理解。
: 只要SAS有竞争对手,而且是大公司,就可以雇一堆人搞好 R 的开源,
: 就像之前 Google 为首的公司用开源搞 M$ 这类闭源公司一样,那样 SAS 才真的会玩
: 完。
: Open Source 里面厉害的东西多了,因为背后可能有各种大佬支持的, 再加上 CS 民间
: 高手确实也多。

1 (共1页)
进入Programming版参与讨论
相关主题
[合集] perl 下面 TLS/SSL IMAP module??open source的开发者到底拿什么养活老婆孩子?
这样的开源软件合作靠谱吗? (转载)iOS开发有没有Java里的开源框架的概念?
eclipse的autotools插件不工作如何有效 DEBUG 开源软件中的 BUG?
哪里能找到开源的file system代码会Python就可以当码工了?
还是别争了,从旁观者角度看,两个方案没准都能工作大家觉得C++还有生命力吗?
Help needed! LDAP Integration with hosted applications (转载)王开源:从诺顿误杀WinXP后门误猜国家机密 (转载)
我终于开源过了Qt/Windows 开源版本将支持 VS Express
ifanr:到底谁才是真正的隐形战友——开源软件和 OpenSSL 的真实故事(zz)SSL Session的问题
相关话题的讨论汇总
话题: sas话题: source话题: 统计话题: open话题: python