y****n 发帖数: 118 | 1 偶作了一个问卷调查,准备根据回收的data做几个回归。 在我的模型里有几个
curvilinear relationship,但是现在两个indepdent variable 都和它的平方有非常
强的线性关系, Pearson's Correlation 0.97 and 0.99,这是咋回事。我用spss做的
correlation. 难道是每个变量的variance 比较小。
这下偶的regression 测不了curvilinear relationship 了。 大家有什么建议
多谢 |
k***g 发帖数: 7244 | 2 呵呵,你是说你的IV 和 它自己的平方的 correlation 比较高?应该是你的数据分布
的问题,是不是都集中在 1 附近的区域中了?举个例子,譬如你的 IV x 在[.95,1.07
]是这个区间内的10个数,那么 x 和 x^2 的 linear correlation 大概能有 0.
999865237 这么高。
【在 y****n 的大作中提到】 : 偶作了一个问卷调查,准备根据回收的data做几个回归。 在我的模型里有几个 : curvilinear relationship,但是现在两个indepdent variable 都和它的平方有非常 : 强的线性关系, Pearson's Correlation 0.97 and 0.99,这是咋回事。我用spss做的 : correlation. 难道是每个变量的variance 比较小。 : 这下偶的regression 测不了curvilinear relationship 了。 大家有什么建议 : 多谢
|
y****n 发帖数: 118 | 3 因为我的数据来自一个问卷,所以数值在1-7之间。
一个变量的sample为,
5.33
5.67
4.67
4.33
1.67
2.00
2.00
4.00
1.67
5.00
5.00
6.00
4.00
它的平方为
28.44
32.11
21.78
18.78
2.78
4.00
4.00
16.00
2.78
25.00
25.00
36.00
16.00
他们的correlation 为 0.989
我记得统计数上说correlation 指的是线性相关关系。Intuitively 一个变量和她的平
方应该不是线性关系。不然的话,curvilinear relationship 怎么测?
请支招 |
k***g 发帖数: 7244 | 4 呵呵,还是数据分布的问题啊,如果都是正值,X 和 X^2 的线性相关总是很高(即便
是你改变scale效果也不明显),除非有负值,这样才能显示出 quadratic relation
来,譬如 -2 -1 0 1 2 和他们平方之间的linear correlation 是 0,这样才能显示
出 linear 和 quadratic 的差异来。
【在 y****n 的大作中提到】 : 因为我的数据来自一个问卷,所以数值在1-7之间。 : 一个变量的sample为, : 5.33 : 5.67 : 4.67 : 4.33 : 1.67 : 2.00 : 2.00 : 4.00
|
x*****a 发帖数: 79 | 5 one way out is to standardize your variable before you square it |