l******e 发帖数: 895 | 1 我有81个obs, 其中只有7个是cases, 也就是1, 其余都是0。
然后有20个predictor variable, 想做model selection, 再predict y, 是不是结果会
不太好?
我试了一下,predict出来全是0.
请问有别的machine learning做classification的方法对这种情况好用吗? |
h***x 发帖数: 586 | 2 I don't think 7 cases will provide sufficient statistical power to build a
model.
【在 l******e 的大作中提到】 : 我有81个obs, 其中只有7个是cases, 也就是1, 其余都是0。 : 然后有20个predictor variable, 想做model selection, 再predict y, 是不是结果会 : 不太好? : 我试了一下,predict出来全是0. : 请问有别的machine learning做classification的方法对这种情况好用吗?
|
l******e 发帖数: 895 | 3 谢谢!我也觉得7个太少了。
另一个data set 有14个1,是不是也太少了?
另外顺便抓住牛人问一下,我在自学machine learning中,请问logistic regression,
discriminant analysis, random forest这些方法做classification都有什么优缺点
阿?这几个都是supervised learning,如果response是binary的话,感觉logistic
regression 就能搞定了啊。
【在 h***x 的大作中提到】 : I don't think 7 cases will provide sufficient statistical power to build a : model.
|
c***z 发帖数: 6348 | 4 no way with 7 cases...
just do a mean and SD, and be happy |
s****u 发帖数: 1200 | 5 over sampling?
★ 发自iPhone App: ChineseWeb 7.8
【在 l******e 的大作中提到】 : 我有81个obs, 其中只有7个是cases, 也就是1, 其余都是0。 : 然后有20个predictor variable, 想做model selection, 再predict y, 是不是结果会 : 不太好? : 我试了一下,predict出来全是0. : 请问有别的machine learning做classification的方法对这种情况好用吗?
|
d*******n 发帖数: 217 | 6 Bayesian能用?把no case当baseline |
s*******1 发帖数: 146 | 7 Zero-inflated negative binomial regression ? |
s*r 发帖数: 2757 | 8 agresti的书上说每10个observation on each level用一个predictor |
|
y*****w 发帖数: 1350 | 9 The rule of thumb is to include one predictive variable per 10 events. In LZ
's case, he only got 7 events, so there surely is no enough power.
【在 s*r 的大作中提到】 : agresti的书上说每10个observation on each level用一个predictor
|
l******e 发帖数: 895 | 10 i see. 请问这本书全名叫啥?thanks
【在 s*r 的大作中提到】 : agresti的书上说每10个observation on each level用一个predictor
|
S****E 发帖数: 150 | 11 这个不是用来model count data的吗?
【在 s*******1 的大作中提到】 : Zero-inflated negative binomial regression ?
|