boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 做logistic regression,cases很少但是predictor很多
相关主题
工作一年求建议
model和variables都sig.但每个category都不sig
请教一个面试问题。
ks 只有28%
any regression model with high prediction accuracy?
Linear Regression
multicollinearity和 predicion model
弱问两个统计题
菜鸟问个logistic regression的问题
急问高手,怎样在SAS实现logistic regression里independent variable重要性排序?
相关话题的讨论汇总
话题: predictor话题: regression话题: cases话题: logistic话题: predict
进入Statistics版参与讨论
1 (共1页)
l******e
发帖数: 895
1
我有81个obs, 其中只有7个是cases, 也就是1, 其余都是0。
然后有20个predictor variable, 想做model selection, 再predict y, 是不是结果会
不太好?
我试了一下,predict出来全是0.
请问有别的machine learning做classification的方法对这种情况好用吗?
h***x
发帖数: 586
2
I don't think 7 cases will provide sufficient statistical power to build a
model.

【在 l******e 的大作中提到】
: 我有81个obs, 其中只有7个是cases, 也就是1, 其余都是0。
: 然后有20个predictor variable, 想做model selection, 再predict y, 是不是结果会
: 不太好?
: 我试了一下,predict出来全是0.
: 请问有别的machine learning做classification的方法对这种情况好用吗?

l******e
发帖数: 895
3
谢谢!我也觉得7个太少了。
另一个data set 有14个1,是不是也太少了?
另外顺便抓住牛人问一下,我在自学machine learning中,请问logistic regression,
discriminant analysis, random forest这些方法做classification都有什么优缺点
阿?这几个都是supervised learning,如果response是binary的话,感觉logistic
regression 就能搞定了啊。

【在 h***x 的大作中提到】
: I don't think 7 cases will provide sufficient statistical power to build a
: model.

c***z
发帖数: 6348
4
no way with 7 cases...
just do a mean and SD, and be happy
s****u
发帖数: 1200
5
over sampling?

★ 发自iPhone App: ChineseWeb 7.8

【在 l******e 的大作中提到】
: 我有81个obs, 其中只有7个是cases, 也就是1, 其余都是0。
: 然后有20个predictor variable, 想做model selection, 再predict y, 是不是结果会
: 不太好?
: 我试了一下,predict出来全是0.
: 请问有别的machine learning做classification的方法对这种情况好用吗?

d*******n
发帖数: 217
6
Bayesian能用?把no case当baseline
s*******1
发帖数: 146
7
Zero-inflated negative binomial regression ?
s*r
发帖数: 2757
8
agresti的书上说每10个observation on each level用一个predictor
y*****w
发帖数: 1350
9
The rule of thumb is to include one predictive variable per 10 events. In LZ
's case, he only got 7 events, so there surely is no enough power.

【在 s*r 的大作中提到】
: agresti的书上说每10个observation on each level用一个predictor
l******e
发帖数: 895
10
i see. 请问这本书全名叫啥?thanks

【在 s*r 的大作中提到】
: agresti的书上说每10个observation on each level用一个predictor
S****E
发帖数: 150
11
这个不是用来model count data的吗?

【在 s*******1 的大作中提到】
: Zero-inflated negative binomial regression ?
1 (共1页)
进入Statistics版参与讨论
相关主题
急问高手,怎样在SAS实现logistic regression里independent variable重要性排序?
logistic regression on 3 billion records (转载)
如何evaluate对binomial distribution的预测模型
rare events的modeling 问题
今天和一个阿三聊segmented logistic regression
大家做过这个面试题吗?
Weighted logistic Regression
攒人品,发Google Statistician/Data Scientist电面面经
any difference between probit regression and logistic regression
问大家一个propensity score matching 的问题
相关话题的讨论汇总
话题: predictor话题: regression话题: cases话题: logistic话题: predict