R********n 发帖数: 519 | 1 比如根据已经有的数据得到了回归系数beta,这个时候如果来了一个新点x_new,但是
没有y_new,我可以得到估计的y_est = x_new'*beta,这个时候,怎么得到y_est的置
信区间呢?
回归时可以得到beta的95%置信区间,但是感觉用这个区间去算y_est的置信区间不太合适
或者,可以看回归的时候的mse,取s=sqrt(mse),(近似认为回归误差是高斯分布),
然后认为y_est的95%的区间就是y_est加减2*s?(还是此处应该用t-distrubtion?)
谢谢~~ | s********0 发帖数: 2625 | 2 如果是一般的linear regression, google prediction interval;
如果是glm,不太清楚。 | R********n 发帖数: 519 | 3 thanks. linear regression,查了下,似乎用t分布做为系数,乘在root of MSE前
面,t_{\alpha/2,n-2} * root of MSE(还有个系数,不过基本是1)
感觉这样是make sense?
【在 s********0 的大作中提到】 : 如果是一般的linear regression, google prediction interval; : 如果是glm,不太清楚。
| w*******9 发帖数: 1433 | 4 原来黎曼只是数学很好哈哈。你这个既不是ci for the mean response, 也不是
prediction interval. 作为Prediction interval, 你忽略了the variability of the
estimated beta. | R********n 发帖数: 519 | 5 回归后beta也有一个interval,i.e., 95% interval,但是直接拿这个去算preidction
的interval感觉不太合适,这个interval是针对每个单独的beta系数的,不是把beta看
成一个vector的~~
所以我才觉得用square root of MSE (sigma),就是y_est +/- c*sigma,当然c这个因
子需要去确定
你觉得这样make sense吗?
the
【在 w*******9 的大作中提到】 : 原来黎曼只是数学很好哈哈。你这个既不是ci for the mean response, 也不是 : prediction interval. 作为Prediction interval, 你忽略了the variability of the : estimated beta.
| w*******9 发帖数: 1433 | 6 有一定的道理,取决于你怎么取c,但肯定不是1.96或qt(0.975,df)。
这样看,你如何预测新的y呢?一个reasonable的预测可以是pred.y=hat.beta*x0+
epsilon,这里hat.beta (could be a vector) 是估计的beta,x0是你想了解的subject
的covariate,epsilon是和hat.beta独立的扰动。这样你
取pred.y的variance, more precisely, the estimated variance, 就是 x0'Var(hat.
beta)x0+MSE, 这个var(hat.beta)~MSE*(H(x) -- something related to the design
matrix), so var(pred.y)=MSE(1+x0'*H(x)*x0). So if you could choose c
according to var(pred.y), you'll get what the textbook tells us.
If I fail to make the point clear, please go to google (prediction interval
+ linear regression) for help.
preidction
【在 R********n 的大作中提到】 : 回归后beta也有一个interval,i.e., 95% interval,但是直接拿这个去算preidction : 的interval感觉不太合适,这个interval是针对每个单独的beta系数的,不是把beta看 : 成一个vector的~~ : 所以我才觉得用square root of MSE (sigma),就是y_est +/- c*sigma,当然c这个因 : 子需要去确定 : 你觉得这样make sense吗? : : the
| R********n 发帖数: 519 | 7 thanks~~你说得很清楚,也google了下,interval应该是y_est +/- t(0.025,N-2) *
sigma * c1,c1是从beta那边算出来的一个因子
实际中,感觉从c1在N比较大的时候基本就是1?c1 = sqrt(1+1/N+(x_new-mean(x)^2/S
_{xx}))
subject
hat.
design
interval
【在 w*******9 的大作中提到】 : 有一定的道理,取决于你怎么取c,但肯定不是1.96或qt(0.975,df)。 : 这样看,你如何预测新的y呢?一个reasonable的预测可以是pred.y=hat.beta*x0+ : epsilon,这里hat.beta (could be a vector) 是估计的beta,x0是你想了解的subject : 的covariate,epsilon是和hat.beta独立的扰动。这样你 : 取pred.y的variance, more precisely, the estimated variance, 就是 x0'Var(hat. : beta)x0+MSE, 这个var(hat.beta)~MSE*(H(x) -- something related to the design : matrix), so var(pred.y)=MSE(1+x0'*H(x)*x0). So if you could choose c : according to var(pred.y), you'll get what the textbook tells us. : If I fail to make the point clear, please go to google (prediction interval : + linear regression) for help.
|
|