topics

全部话题 - 话题: rsquare
1 (共1页)
z****n
发帖数: 67
1
请问SAS中proc mixed为什么没有Rsquare的输出? 理论上可以自及计算吗?
如果没有Rsquare怎么判断模型好坏呢?
i*****r
发帖数: 1302
2
实际值为正的话,我的预测值为正,就OK
有时候有predictive power的模型Rsquare却很小,所以找别的
i*****r
发帖数: 1302
3
哎...其实我的想法是想抛开这些学术书本上的东西,这些东西谁都知道,想从更实际应
用的地方出发.比如regression,某些vairable在某段时间内有预测能力的,但可能从某
点开始作用就慢慢下降,也许不久又会上升.当你意识到的时候,比如tstats,rsquare变
小的时候,已经发生了太晚了.我就在想能不能有什么办法能early detect模型的变化,
能够及时换走variable或者干脆放弃使用
l******i
发帖数: 1404
4
得出的值方向不对,说明model本身有问题。
选择predictor:如果predictor数目多的话(注意multicollinearity),建议用
stepwise model selection;predictor数目少的话,用all subset search.
在所有感兴趣的model里用R_adjusted_square结合C(p)和PRESS(p)判断。也可以结合
AIC, BIC, SIC。判据越多越好。
不过唯一的最好办法:get much more data, need sample size to be large enough.
这样asymtotic理论下的所有test就有意义了。也就不存在你说的Rsquare一会儿大一会儿小的问题了。
结果实在差的很远,不整regression,用multifactor ANOVA Model
再不行,就用nonparametric approach呗,例如bootstrapping
v*******e
发帖数: 11604
5

这太容易了。Pvalue can be as small as you want.
N=c(100,1000,10000,100000)
PValue=rep(as.numeric(NA),length(N))
RSquared=rep(as.numeric(NA),length(N))
for (i in 1:length(N)){
sigmma=rnorm(N[i],0,1)
x=rnorm(N[i],0,1)
y=0.1*x+sigmma
RSquared[i]=summary(lm(y~0+x))$"r.squared"
PValue[i]=summary(lm(y~0+x))$"coefficients"[1,4]
}
data.frame(N,RSqaured,PValue)
N RSquared PValue
1 1e+02 0.007324693 3.947863e-01
2 1e+03 0.014429159 1.392340e-04
3 1e+04 0.010822982 1.792036e-25
4 1e... 阅读全帖
s******d
发帖数: 538
6
问一个关于linear regression的问题,大家不要笑我。这个问题在我心里有一段时间
了,但一直未找到答案,恳请大家帮忙。就是,linear regression里有Rsquare,如果
Rquare大于一个数,好像是0。7,那么这个model就fit data well。但是linear
regression也有ANOVA和F test, 如果F test 的P-value 很小,例如小于0。05,那么
这个model就fit data well。 但如果有这种情形该怎么解释,就是Rsquare比较大,例
如大于0。9,但F test却不significant,i.e.F test的P-value 比较大,例如大于0。
5。long story short, 就是在linear regression 中,如果根据Rqsuare,这个model
fit data well,但如果根据F test,这个model又不fit data well,好像有矛盾,请
问这种情形真的会发生吗?真的发生了又该怎么解释?如果永远不会发生,其理由和根
据又是什么?多谢答复!
i****x
发帖数: 17565
7
来自主题: Automobile版 - 车子轮胎要多宽多大才算安全?
跟马力有关
你去做回归,马力对驱动轮宽度,绝对超高Rsquare
汽车工程师设计汽车时,一般不会用超过必须的轮胎宽度,否则油耗会有很大影响。

★ 发自iPhone App: ChineseWeb 7.7
i*****r
发帖数: 1302
8
如果我更在乎预测的方向正确与否,多于在乎绝对值是否正确.例如预测10个数值,8个方
向都和实际数值一样,虽然绝对值上有些偏差但我仍然满意
有哪些标准可以判定模型是否work或是break down?
z****e
发帖数: 2024
9
你这个“方向”是怎么定义的?
我的理解是,你在判断哪些参数有意义是吗?
step wise 的话,用AIC行吧?
或者用BMA。Bayesian Model Averaging。
s********7
发帖数: 52
10
t stat for significance
s********a
发帖数: 1100
11
mark
回lz
并不是是个数据就可以用regression的
不如试试nonparametric approach
ls说的非常好

enough.
会儿小的问题了。
s********a
发帖数: 1100
12
某些vairable在某段时间内有预测能力的
你是不是variable 就选的不对 overstate it的能力了。。
i*****r
发帖数: 1302
13
The qestion is: Is there a approach to early detect if a model is working or
breaking down?
regression只是个例子
l******i
发帖数: 1404
14

or
get much more data, need sample size to be large enough.
不考虑时间的话,也就是你所有数据都是independent的话,不管是不是regression,
你所有的model和test都是基于asymptotic theory。如果你的sample size足够大,你
的model checking又足够多了的话,你的model应该一直是对的,不会有突然间model
break down的问题。
如果考虑时间correlation的话,你要不停变换model的predictors和volatility w.r.t
. time,最好用用ARMA(1,1), GARCH(1,1) 等等financial econometric的model试试,
还有很多其他更复杂的time series model可以让你的model里很多东西都跟时间有关,
接下来怎么做要看具体情况了。
l******i
发帖数: 1404
15
经济良好市场稳定的时候,50%靠模型,50%靠经验。
经济不好市场不稳定的时候,100%靠经验。不管什么approach/model,在这种时候,都
是bullshit,市场无法模拟。
s********a
发帖数: 1100
16
no model is perfect
model would break down when extreme event happens
get more data if possible
or try adjust weights of each factor accoding to time change

or
i******r
发帖数: 323
17
来自主题: Statistics版 - 笨人求问sas function
1。我用proc reg, ridge, 有一些c value, c=0 to 0.1 by 0.05, 我要在output里有
VIF 和r2,这样我可以判断哪个c最好。我用了
proc reg data=a outest=b outvif rsquare ridge=0 to 0.1 by 0.05;
但是,我的output里只有c=0 的rsqare, 后面就成了missing value.我不知道这对不对
,还有我用的是sas 9.1.
2。也是sas题, observations on Y are to be taken when x=10,20,30,40,50,
respectively. The true regression function is E{Y}=20+10x. The error terms
are independent and normally distributed, with E{error}=0 and variance=0.8x.
How to generate random Y observations for each X level i
l***a
发帖数: 12410
18
来自主题: Statistics版 - R-square of logistic regression
yes. use rsquare option in model statement
m****r
发帖数: 237
19
来自主题: Statistics版 - 如何拒绝一个线性假设
adj-Rsquare,还要看residual analysis...要符合线性模型的假设呀
s******g
发帖数: 193
20
【 以下文字转载自 JobHunting 讨论区 】
发信人: swanking (TJ Max), 信区: JobHunting
标 题: 有在找统计工作的人么?SAS问题求教
发信站: BBS 未名空间站 (Mon Mar 29 12:04:48 2010, 美东)
我导入一个excel文件后进行cluster analysis,导入过程一切顺利,但是不知道怎么
样分析,因为不知道怎么设置变量名。
我的做法是把excel第一行设置成变量名,数据从第二行开始,然后:
proc import datafile="D:\temp\table7_1.xls" out=table7_1 dbms=excel replace;
getnames=yes;
mixed=no;
scantext=yes;
run;
proc cluster data=table7_1 method=centroid simple noeigen rmsstd rsquare
nonorm out=tree;
id sid;
var income educ;
run;
sid income educ都是变量名,但
s*******y
发帖数: 2977
21
Rsqure大不一定是overfitting,跟你的number of variables and sample size都有关
系。建议看一看Frank Harrell的 regression modeling strategies。
lz的variable很多,建议fit model之前先检查colinearity,对于highly correlated
的variable,keep一个(比如说univariate fitting里rsquare最好的那个),然后再
用stepwise或penalized variable selection.不过2007年好像有个加拿大人写的一篇
文章做了很详细的simulation,比较了backward selection加或不加bootstrapping都
不会给出很好的结果,嘿嘿,eye-dropping conclusions。
a*****3
发帖数: 601
22
我在cterm底下啊 -机器染木马了浏览器不能开,sas每10保存一次,否则机器freeze写
的代码都没了。
反正这个图,x轴是rsqure, y轴是3,40个变量,在同一个cluster的变量是相邻的,根
据业务需要选取一个。随着rsquare的递减,cluster也递减。varclus还生成很多中间结
果 不过我也看不太懂。汗。
S********a
发帖数: 359
23
来自主题: Statistics版 - [包子] R的结果里求AIC
有个conditional logistic regression,想看AIC,但是结果里并没有给出来,请教什么
code或者命令把AIC求出来。谢谢。
> result0<-clogit(case~hr0+strata(subjid), data=mydata)
> summary(result0)
Call:
coxph(formula = Surv(rep(1, 9704L), case) ~ hr0 + strata(subjid),
data = mydata, method = "exact")
n=8397 (1307 observations deleted due to missingness)
coef exp(coef) se(coef) z Pr(>|z|)
hr0 0 0.001158 1.001158 0.005376 0.215 0.83
exp(coef) exp(-coef) lower .95 upper .95
hr0 1.001 ... 阅读全帖
c**i
发帖数: 234
24
现在是这么做的,但是fit出来Rsquare只有70%不到,不知道是不是因为response
variable不是follow normal distribution的缘故,是不是应该先把response
variable做一下transformation?
l*******s
发帖数: 437
25
来自主题: Statistics版 - 大数据的处理
听有人说现在流行的是把比较大的数据分成十份后做统计分析,然后再比较分析这十份
,是吗?
另外还有个问题,我有个数据,大概有1000多个observation,十个variable,但是我
的dependent variable 不服从正态分布,transform之后也不行,这种情况下build
Linear regression model之后, Rsquare就很低,才0.02, residual plots也肯定不
好了。
请问应该怎么处理呢?
一并谢了!
p********a
发帖数: 5352
26
☆─────────────────────────────────────☆
cici (full house) 于 (Mon Nov 7 08:33:47 2011, 美东) 提到:
对于logistic regression
log(pi/1-pi)=b0+b1x1+b2x2
我现在已知independent variables和response variable{log(pi/1-pi)}
我要怎么做才能把参数b0,b1,b2 fit出来?非常感谢
☆─────────────────────────────────────☆
sleephare (I+don't+know.) 于 (Mon Nov 7 14:16:38 2011, 美东) 提到:
SAS, R?

☆─────────────────────────────────────☆
cici (full house) 于 (Mon Nov 7 16:19:05 2011, 美东) 提到:
R,thanks
☆────────────────────────────────────... 阅读全帖
mw
发帖数: 525
27
外行来问个外行的问题哈,在R里面做个lm
lm(A ~ 0+观测值)
得到的R只有0.001 0.002之类的,可是当我把观测值做个bracket,得到一个table
观测值 | A
-----------------
-0.003 -2
-0.002 -1
-0.001 -1
0 0
0.001 0
0.002 1
0.003 0
我觉得这里明明有一个很强烈的关系存在嘛 ,为什么Rsquare 这么低呢?
有没有专业人士给我解释一下?
谢谢了
E**********e
发帖数: 1736
28
来自主题: Statistics版 - three way anova
如果高级项统计上不重要,当然可以drop掉。如果某个高级项重要,但是相应的一次项
不重要,就要保留一次项。这是统计上基本的东西。还有可以看别的一些metric,像
Rsquare。减去或加上某一项,AIC/BIC变化大不大。

:y~ 1+ a+b+c+ab+ac+bc+abc
1 (共1页)