d****i 发帖数: 121 | 1 一个model:
y=a+b*x
我觉得当x为负数的时候suppose对y的影响更大,我就想加一个dummy进去,当x<0时,
dummy=1,当x>=0的时候,dummy=0。
那么model是写作y=a+b*x+b2*dummy,还是y=a+b*x+b2*dummy*x比较好?
怎样能看出dummy确实是有影响呢?
初学者,请指教,谢谢! | D*****a 发帖数: 2847 | 2 看哪个更符合了
这俩一个改变的是intercept一个改变的是slope
【在 d****i 的大作中提到】 : 一个model: : y=a+b*x : 我觉得当x为负数的时候suppose对y的影响更大,我就想加一个dummy进去,当x<0时, : dummy=1,当x>=0的时候,dummy=0。 : 那么model是写作y=a+b*x+b2*dummy,还是y=a+b*x+b2*dummy*x比较好? : 怎样能看出dummy确实是有影响呢? : 初学者,请指教,谢谢!
| n*****1 发帖数: 172 | 3 y=a+b*x+b2*dummy的话, 你改变的是intercept, 就是说x是负数的时候, model变成y=(
a+b2)+b*x, slope还是b, 但
是intercept变成a+b2
y=a+b*x+b2*dummy*x的话, 你改变的是slope, 当x是负数的时候, model变成y=a+(b+b2
)*x, intercept还是a, 但是
slope变成b+b2
具体怎么设置, 你得看你究竟想test什么, 是slope变了, 还是intercept变了, 不过你
说"觉得当x为负数的时候suppose对y
的影响更大", 可能选y=a+b*x+b2*dummy*x比较好
如果coefficient是significant的话, 那么dummy就是确实有影响
【在 d****i 的大作中提到】 : 一个model: : y=a+b*x : 我觉得当x为负数的时候suppose对y的影响更大,我就想加一个dummy进去,当x<0时, : dummy=1,当x>=0的时候,dummy=0。 : 那么model是写作y=a+b*x+b2*dummy,还是y=a+b*x+b2*dummy*x比较好? : 怎样能看出dummy确实是有影响呢? : 初学者,请指教,谢谢!
| d****i 发帖数: 121 | 4 谢谢,再问个啥问题。
为什么说第二种model更好呢?
=(
b2
【在 n*****1 的大作中提到】 : y=a+b*x+b2*dummy的话, 你改变的是intercept, 就是说x是负数的时候, model变成y=( : a+b2)+b*x, slope还是b, 但 : 是intercept变成a+b2 : y=a+b*x+b2*dummy*x的话, 你改变的是slope, 当x是负数的时候, model变成y=a+(b+b2 : )*x, intercept还是a, 但是 : slope变成b+b2 : 具体怎么设置, 你得看你究竟想test什么, 是slope变了, 还是intercept变了, 不过你 : 说"觉得当x为负数的时候suppose对y : 的影响更大", 可能选y=a+b*x+b2*dummy*x比较好 : 如果coefficient是significant的话, 那么dummy就是确实有影响
| n*****1 发帖数: 172 | 5 我那是纯粹从你的原文猜的, 你说"觉得当x为负数的时候suppose对y的影响更大", 我
的理解是当x<0时, y对x的
derivative比较大(绝对值)
如果你的意思是仅仅intercept变了,slope没有变, 那么就选第一种
【在 d****i 的大作中提到】 : 谢谢,再问个啥问题。 : 为什么说第二种model更好呢? : : =( : b2
|
|