q****e 发帖数: 251 | 1 问两个弱弱的问题。请各位大牛赐教。
Generalized logistic regression给出的是predicted probability,比如说我的
response有三个level,对某个observation, model给出的predicted probability分
别是p1, p2, p3. 而数据里三个level的observation所占比例分别是p01, p02, p03.
那么我要做classification的话,应该怎么做呢?
2. 我的数据有大概10 million records, 100 variables, 能称为大数据么? 被问过
怎样efficient的处理和model这样的数据。以及怎样做variable selection. 怎么答才
好呢?我是用sas做的, glm为主。 |
|