c******x 发帖数: 350 | 1 各位大牛指点一下。
假设我想拟合以下公式:
y1 = A*X1 + B*X1^2 + C*X2 + D (1)
y2 = A*X1 + B*X1^2 + C*X2 + D (2)
.
.
yn = A*X1 + B*X1^2 + C*X2 + D (n)
在以上各式中,X1,和X2会取不同值,比如说不同的长度和宽度。但是与通常拟合不同
的是,y1..yn是一个区间,不是一个确定的值。
换言之,A,B,C和D拟合出来,只要y的值在各个区间内就可以。当然ABCD可能存在多
组解。
我测试了matlab中的nonlfit,regress等函数,都无法解决这个问题。 |
w*******9 发帖数: 1433 | 2 y_i 是只观测到属于某个区间吗?如果是,那么这是interval censored data。Cox
model, AFT model可以考虑。出于interpretation的考虑,能说说这些y_i都代表什么
实际的东西吗? |
c******x 发帖数: 350 | 3 对的,y_i属于某个区间。比如说y_i是收入,x是学历,家庭背景等等。对应于各个学
历,收入应该是个区间,比如说100个高中学历,收入区间为20K到30K,100个大学学历
,收入区间为30K到40K,等等。如果只考虑学历的话,那就是一元函数拟合,没有问题
。但是对于多元函数,比如加上家庭背景,好像无法简单拟合。
【在 w*******9 的大作中提到】 : y_i 是只观测到属于某个区间吗?如果是,那么这是interval censored data。Cox : model, AFT model可以考虑。出于interpretation的考虑,能说说这些y_i都代表什么 : 实际的东西吗?
|
c******x 发帖数: 350 | 4 请教一下,有经典的文献介绍这些模型吗?
【在 w*******9 的大作中提到】 : y_i 是只观测到属于某个区间吗?如果是,那么这是interval censored data。Cox : model, AFT model可以考虑。出于interpretation的考虑,能说说这些y_i都代表什么 : 实际的东西吗?
|
P****D 发帖数: 11146 | 5 你这个区间的原始数据是怎样得来?是平时看到的网上survey 那样,几个选项,“两
万到三万”是一个选项,“三万到四万”是一个选项,这样?
是的话,普通logistic regression 即可。
【在 c******x 的大作中提到】 : 对的,y_i属于某个区间。比如说y_i是收入,x是学历,家庭背景等等。对应于各个学 : 历,收入应该是个区间,比如说100个高中学历,收入区间为20K到30K,100个大学学历 : ,收入区间为30K到40K,等等。如果只考虑学历的话,那就是一元函数拟合,没有问题 : 。但是对于多元函数,比如加上家庭背景,好像无法简单拟合。
|
w*******9 发帖数: 1433 | 6 如果这样,把收入当离散的用multi logistic regression就行
【在 c******x 的大作中提到】 : 对的,y_i属于某个区间。比如说y_i是收入,x是学历,家庭背景等等。对应于各个学 : 历,收入应该是个区间,比如说100个高中学历,收入区间为20K到30K,100个大学学历 : ,收入区间为30K到40K,等等。如果只考虑学历的话,那就是一元函数拟合,没有问题 : 。但是对于多元函数,比如加上家庭背景,好像无法简单拟合。
|