c**********2 发帖数: 144 | 1 在做一个logistic regression,目前model里有9个variable,当我plot actual vs.
predicted的P(Y=1)的时候,发现在p=0.8-0.9左右是over predict,请问应该怎么找问
题?我不知道如何入手。
还有就是同事常说,如果一个var跟另外一个很correlated,就不能两个都加入,这个
是为了防止overfit吗?
谢谢! |
s*********e 发帖数: 1051 | 2 1)what do you mean 'over-predict'?
2)what your coworker meant is 'colinearity' |
o****o 发帖数: 8077 | 3 你应该用残差(pearson或者chi-sq)来跟自变量画图,而不是实际值vs fitted 值,
后者只能告诉你模型拟合好不好。一般通行的方法是用Cook's D against 自变量
【在 c**********2 的大作中提到】 : 在做一个logistic regression,目前model里有9个variable,当我plot actual vs. : predicted的P(Y=1)的时候,发现在p=0.8-0.9左右是over predict,请问应该怎么找问 : 题?我不知道如何入手。 : 还有就是同事常说,如果一个var跟另外一个很correlated,就不能两个都加入,这个 : 是为了防止overfit吗? : 谢谢!
|
j*****e 发帖数: 182 | 4 CHECK THE BOOK "APPLIED LOGISTIC REGRESSION" BY HOSMER AND LEMESHOW.THERE IS
AN ENTIRE CHAPTER DEVOTED TO MODEL CHECKING.AND YOU CAN DO EVERYTHING IN
SAS. FOR BINARY OUTCOME,THERE ARE SEVERAL WAYS DEFINE RESIDUALS (AND YOU
HAVE TO STANDARDIZE THEM).
【在 c**********2 的大作中提到】 : 在做一个logistic regression,目前model里有9个variable,当我plot actual vs. : predicted的P(Y=1)的时候,发现在p=0.8-0.9左右是over predict,请问应该怎么找问 : 题?我不知道如何入手。 : 还有就是同事常说,如果一个var跟另外一个很correlated,就不能两个都加入,这个 : 是为了防止overfit吗? : 谢谢!
|