w**********e 发帖数: 146 | 1 请教一下,我不太懂这个:有个dataset大约3万record,做了一个multivariate
regression,其中dependent var是「hours needed」,是continuous的,三个
independent var,其中两个是值为0/1的categorical var「daytime_or_not,
weekend_
or_not」,第三个是个continous。简单用excel的regression tool run了一下,怎么r
square只有0.0015,是不是这方法根本就用错了?
★ 发自iPhone App: ChineseWeb 7.8
★ 发自iPhone App: ChineseWeb 7.8 |
b********r 发帖数: 764 | |
w**********e 发帖数: 146 | 3 谢谢!还有几个问题请教:
1,几个var的p value都很小或就是0,是不是说明他们都很significant?但是放在一
起却不能predict?这应该怎么解释。
2,建model前是不是要看看每个var单独的distribution,有关联的再放进model去?
我对regression的原理懂一些,不过没有实际经验。非常感谢达人帮助。
【在 b********r 的大作中提到】 : 就是无关变量。。。有什么办法。。
|
t*******2 发帖数: 384 | 4 seems like due to huge sample size |
t*******2 发帖数: 384 | |
w**********e 发帖数: 146 | 6 谢谢!就是说如果sample size很大,这些var的P-value意义不大?我不是很清楚这是
什么的意思。
【在 t*******2 的大作中提到】 : I mean the significance
|
t*******2 发帖数: 384 | 7 P-value is based on t-test involving sample variance |
w**********e 发帖数: 146 | 8 那么判断一个model的好坏是不是首先看r square?如果这个很低,就不用看variable
了吧。
★ 发自iPhone App: ChineseWeb 7.8
【在 t*******2 的大作中提到】 : P-value is based on t-test involving sample variance
|
w*******9 发帖数: 1433 | 9 check下每个independent var 和 dependent var 的scatter plot, 看有没有啥趋势
,没啥趋势的话,绝大多数时候就是data 本身噪音很大,you cant do much about it
. Otherwise, you can get important information on potential nonlinear
pattern or interaction. |
w**********e 发帖数: 146 | 10 谢谢!再确认一下刚才问的:建好regression model后是不是应该首先看r square?然
后看每个var的p value?我想知道检查一个model好坏的步骤。
it
★ 发自iPhone App: ChineseWeb 7.8
【在 w*******9 的大作中提到】 : check下每个independent var 和 dependent var 的scatter plot, 看有没有啥趋势 : ,没啥趋势的话,绝大多数时候就是data 本身噪音很大,you cant do much about it : . Otherwise, you can get important information on potential nonlinear : pattern or interaction.
|
|
|
m********9 发帖数: 208 | 11 Consider two-way or three way interaction terms. the small value of R^2 does
not mean that the model is not significant from a statistical viewpoint. |
w*******9 发帖数: 1433 | 12 r square是大是小取决于你data和需求以及你拥有的其它选择。即使R^2很大,也不表
示model就很好。比如实际问题中你得到一个R^2=0.99,基本上可以肯定是model
assumption 不满足导致的假象。严格的regression是model完了check model
assumption (对LM 而言就是residual analysis). 有时候着重点是如何改进已有model
,而不是完全摒弃重头再来。
【在 w**********e 的大作中提到】 : 谢谢!再确认一下刚才问的:建好regression model后是不是应该首先看r square?然 : 后看每个var的p value?我想知道检查一个model好坏的步骤。 : : it : ★ 发自iPhone App: ChineseWeb 7.8
|
w**********e 发帖数: 146 | 13 非常感谢楼上二位。不知道是否可以推荐一些有具体regression model实例的书和网站
?
我看过一些书, 但所有书里面的model用的都是很简单和干净的数据,到了实际中就发
现理论知识根本不够用。如果每天工作不是做modeling的,不知用什么办法可以提高水
平。我对predictive modeling很有兴趣,但是也许理论知识还不够扎实,所以自己琢
磨一些实际例子的时候总感到知识不够用。
model
★ 发自iPhone App: ChineseWeb 7.8
【在 w*******9 的大作中提到】 : r square是大是小取决于你data和需求以及你拥有的其它选择。即使R^2很大,也不表 : 示model就很好。比如实际问题中你得到一个R^2=0.99,基本上可以肯定是model : assumption 不满足导致的假象。严格的regression是model完了check model : assumption (对LM 而言就是residual analysis). 有时候着重点是如何改进已有model : ,而不是完全摒弃重头再来。
|
l*******s 发帖数: 437 | |
W**********E 发帖数: 242 | 15 "比如实际问题中你得到一个R^2=0.99,基本上可以肯定是model
你是指multicollinearity?
model |