m******r 发帖数: 1033 | 1 说R语言之前,说说王yin同学, 这人还是很牛b的; 牛b的人总有一些与众不同的地方
,普通人无法理解。 我看我儿子,好像总爱和我反着来 让我哭笑不得 他还挺认真。
想想算了 由他去吧。
然后说R语言。先说这个glm, 按说向前,向后,逐步回归(forward/backward/stepwise
)应该是glm里面一个重要选项才对。 没有这个选项,跑出来的东西我看毫无意义,当
然,你可以说他算了一堆数出来, So ?
第二,你可以用stepAIC,接着往下算。 我觉得很awkward, 本来一步的东西分两步走
,最后结果你给我存哪呢?? 你让我怎么做automation呢?? 这种文档谁又看得懂呢
??
https://stat.ethz.ch/R-manual/R-devel/library/MASS/html/stepAIC.html
第三,老是写deviance, 我不记得统计书里说什么deviance, 都是说-2L. 当然我才疏
学浅,有懂得给说说,这个deviance是个啥意思? | v*******e 发帖数: 11604 | 2 程序员搞起统计来了。。。你问的都是统计问题,不是R的问题。
1)glm 它就是个迭代的算某一类特定model参数的程序/方法,当然要算到收敛为止。
没听说glm里面还有forward/backward/stepwise这类的东西。
2)AIC,BIC这类东西是用来选model的,不是用来算model参数的。model里面要包含哪
些变量,不包含哪些变量(比如没有多少影响的变量就别包含在内了),这是AIC,BIC
之类东西的用处。如果你用它来决定你的general linear model里面需要包含哪些变量
,当然要和glm()交替运用。你先选一些变量做成model,然后用glm()算出这个
model的参数和likelihood,再增/减变量,再用glm()算出参数和likelihood,然后你
就能用AIC决定要不要把这增/减的变量包含在内。
3)wikipedia有简短介绍。
stepwise
【在 m******r 的大作中提到】 : 说R语言之前,说说王yin同学, 这人还是很牛b的; 牛b的人总有一些与众不同的地方 : ,普通人无法理解。 我看我儿子,好像总爱和我反着来 让我哭笑不得 他还挺认真。 : 想想算了 由他去吧。 : 然后说R语言。先说这个glm, 按说向前,向后,逐步回归(forward/backward/stepwise : )应该是glm里面一个重要选项才对。 没有这个选项,跑出来的东西我看毫无意义,当 : 然,你可以说他算了一堆数出来, So ? : 第二,你可以用stepAIC,接着往下算。 我觉得很awkward, 本来一步的东西分两步走 : ,最后结果你给我存哪呢?? 你让我怎么做automation呢?? 这种文档谁又看得懂呢 : ?? : https://stat.ethz.ch/R-manual/R-devel/library/MASS/html/stepAIC.html
| l*********s 发帖数: 5409 | 3 forward/backward/stepwise 是搜索模型的方法,都是基于贪婪原则,不能保证你找到
全局最优解。 | m******r 发帖数: 1033 | 4 首先谢谢你的回答。
我是民间数据‘科学家’, 听不懂理论讲解,不过还好会看数字。 谁能说说说,如果
我想用R做一下的输出,有没有简单的办法。 stepAIC似乎不行,我试过了。
http://www.stat.pitt.edu/stoffer/stepwiseregression.pdf 这篇文章4各变量,讨论对销售的影响,向前向后逐步法都有了,随便什么方法,看一眼都明白了。
https://ncss-wpengine.netdna-ssl.com/wp-content/themes/ncss/pdf/Procedures/
NCSS/Stepwise_Regression.pdf 这篇文章,我只看得懂第六页,因为上面有数字,有
一张大表,先删除第五个变量,因为p=88%, 第二次回归删除变量3,还是因为p value,
剩下三个变量,p都在7%, 挺简单的吧。
请问如何用R 做出类似的东西? 如果可能的话,最好存在什么对象里,最好是张表,
看上去一目了然。
【在 v*******e 的大作中提到】 : 程序员搞起统计来了。。。你问的都是统计问题,不是R的问题。 : 1)glm 它就是个迭代的算某一类特定model参数的程序/方法,当然要算到收敛为止。 : 没听说glm里面还有forward/backward/stepwise这类的东西。 : 2)AIC,BIC这类东西是用来选model的,不是用来算model参数的。model里面要包含哪 : 些变量,不包含哪些变量(比如没有多少影响的变量就别包含在内了),这是AIC,BIC : 之类东西的用处。如果你用它来决定你的general linear model里面需要包含哪些变量 : ,当然要和glm()交替运用。你先选一些变量做成model,然后用glm()算出这个 : model的参数和likelihood,再增/减变量,再用glm()算出参数和likelihood,然后你 : 就能用AIC决定要不要把这增/减的变量包含在内。 : 3)wikipedia有简短介绍。
| v*******e 发帖数: 11604 | 5 你google这些:stepwise glm regression using r,第一个hit就很好,看人家怎么做
的,里面code例子清清楚楚。
: 首先谢谢你的回答。
: 我是民间数据‘科学家’, 听不懂理论讲解,不过还好会看数字。 谁能说说说
,如果
: 我想用R做一下的输出,有没有简单的办法。 stepAIC似乎不行,我试过了。
: http://www.stat.pitt.edu/stoffer/stepwiseregression.pdf 这篇文章4各变量,讨论对销售的影响,向前向后逐步法都有了,随便什么方法,看一眼都明白了。
: https://ncss-wpengine.netdna-ssl.com/wp-content/themes/ncss/pdf/
Procedures/
: NCSS/Stepwise_Regression.pdf 这篇文章,我只看得懂第六页,因为上面有数
字,有
: 一张大表,先删除第五个变量,因为p=88%, 第二次回归删除变量3,还是因为p
value,
: 剩下三个变量,p都在7%, 挺简单的吧。
: 请问如何用R 做出类似的东西? 如果可能的话,最好存在什么对象里,最好是
张表,
: 看上去一目了然。
【在 m******r 的大作中提到】 : 首先谢谢你的回答。 : 我是民间数据‘科学家’, 听不懂理论讲解,不过还好会看数字。 谁能说说说,如果 : 我想用R做一下的输出,有没有简单的办法。 stepAIC似乎不行,我试过了。 : http://www.stat.pitt.edu/stoffer/stepwiseregression.pdf 这篇文章4各变量,讨论对销售的影响,向前向后逐步法都有了,随便什么方法,看一眼都明白了。 : https://ncss-wpengine.netdna-ssl.com/wp-content/themes/ncss/pdf/Procedures/ : NCSS/Stepwise_Regression.pdf 这篇文章,我只看得懂第六页,因为上面有数字,有 : 一张大表,先删除第五个变量,因为p=88%, 第二次回归删除变量3,还是因为p value, : 剩下三个变量,p都在7%, 挺简单的吧。 : 请问如何用R 做出类似的东西? 如果可能的话,最好存在什么对象里,最好是张表, : 看上去一目了然。
| m******r 发帖数: 1033 | 6 是这篇文章吗 ? http://www.utstat.toronto.edu/~brunner/oldclass/appliedf11/handouts/2101f11StepwiseLogisticR.pdf
它的输出是如下:
> # Here was the chosen model from earlier
> redmod1 = glm(low ~ lwt+racefac+smoke+ptl+ht,family=binomial)
>
> backwards = step(fullmod) # Backwards selection is the default
Start: AIC= 221.28
low ~ age + lwt + racefac + smoke + ptl + ht + ui + ftv
Df Deviance AIC
- ftv 1 201.43 219.43
- age 1 201.93 219.93
201.28 221.28
- ptl 1 203.83 221.83
- ui 1 204.03 222.03
- racefac 2 208.75 224.75
- lwt 1 206.80 224.80
- smoke 1 206.91 224.91
- ht 1 208.81 226.81
1.我想看系数,p_value, 能给解决么 ?
2.把结果输出到对象,能给解决么?
3.指定enter,exist criterier, 5%, 10%, 能给解决么?
5.我给出的两篇文章,都是通过p_value,来选变量的(选进,选出)。 他这个是根据
AIC, 我不能说他错。 但我就想随大流,用p_value,请问能给解决么?
【在 v*******e 的大作中提到】 : 你google这些:stepwise glm regression using r,第一个hit就很好,看人家怎么做 : 的,里面code例子清清楚楚。 : : : 首先谢谢你的回答。 : : 我是民间数据‘科学家’, 听不懂理论讲解,不过还好会看数字。 谁能说说说 : ,如果 : : 我想用R做一下的输出,有没有简单的办法。 stepAIC似乎不行,我试过了。 : : http://www.stat.pitt.edu/stoffer/stepwiseregression.pdf 这篇文章4各变量,讨论对销售的影响,向前向后逐步法都有了,随便什么方法,看一眼都明白了。 : : https://ncss-wpengine.netdna-ssl.com/wp-content/themes/ncss/pdf/ : Procedures/
| v*******e 发帖数: 11604 | 7 summary(redmodel1)
: 是这篇文章吗 ? http://www.utstat.toronto.edu/~brunner/oldclass/appliedf11/handouts/2101f11StepwiseLogisticR.pdf
: 它的输出是如下:
:
【在 m******r 的大作中提到】 : 是这篇文章吗 ? http://www.utstat.toronto.edu/~brunner/oldclass/appliedf11/handouts/2101f11StepwiseLogisticR.pdf : 它的输出是如下: : > # Here was the chosen model from earlier : > redmod1 = glm(low ~ lwt+racefac+smoke+ptl+ht,family=binomial) : > : > backwards = step(fullmod) # Backwards selection is the default : Start: AIC= 221.28 : low ~ age + lwt + racefac + smoke + ptl + ht + ui + ftv : Df Deviance AIC : - ftv 1 201.43 219.43
|
|