l***o 发帖数: 5337 | 1 如果我们能分别估计出 X 和 Y 的confidence interval,怎么构建 X/Y 的confidence
interval? X和Y都是关于population的未知常量。谢谢! |
x***x 发帖数: 3401 | |
l***o 发帖数: 5337 | 3 可以合理认为X, Y的估计都是渐进normal。
【在 x***x 的大作中提到】 : 要看x/y的distribution吧。
|
x***x 发帖数: 3401 | 4 独立不?独立的话应该是科西分布 http://en.wikipedia.org/wiki/Cauchy_distribution
【在 l***o 的大作中提到】 : 可以合理认为X, Y的估计都是渐进normal。
|
l***o 发帖数: 5337 | 5 麻烦就在于: 不独立 :(
【在 x***x 的大作中提到】 : 独立不?独立的话应该是科西分布 http://en.wikipedia.org/wiki/Cauchy_distribution
|
g****8 发帖数: 2828 | 6 how about get CI of X^2/Y^2 first ( maybe some distribution related with F)? |
l***o 发帖数: 5337 | 7 不独立似乎怎么都不行。。。
F)?
【在 g****8 的大作中提到】 : how about get CI of X^2/Y^2 first ( maybe some distribution related with F)?
|
l***o 发帖数: 5337 | 8 如果我可以用bootstrap估计出X和Y的correlation,有什么用处呢?
【在 l***o 的大作中提到】 : 不独立似乎怎么都不行。。。 : : F)?
|
x***x 发帖数: 3401 | 9 那你还不如直接bootstrap得到x/y的95% CI。
还有就是直接估计x/y的均值, 这样可以认为x/y的均值是接近正态的。
【在 l***o 的大作中提到】 : 如果我可以用bootstrap估计出X和Y的correlation,有什么用处呢?
|
l***o 发帖数: 5337 | 10 bootstrap方法我试过,standard error太大, CI宽得像大峡谷。。。
【在 x***x 的大作中提到】 : 那你还不如直接bootstrap得到x/y的95% CI。 : 还有就是直接估计x/y的均值, 这样可以认为x/y的均值是接近正态的。
|
|
|
l***o 发帖数: 5337 | 11 x/y的variance也太大(对每个obs, x和y不是1就是0.。。)
【在 x***x 的大作中提到】 : 那你还不如直接bootstrap得到x/y的95% CI。 : 还有就是直接估计x/y的均值, 这样可以认为x/y的均值是接近正态的。
|
x***x 发帖数: 3401 | 12 如果x/y的值只在两头, 那不管你怎么算CI都很大啊。和你用什么方法估计没关系了,数据本身的信息就这样。
问题是那也就是说x和y要么相等,要么y>>x. 那你想用x/y来描述什么呢? 你还不如做个
indicator variable来描述一下x=y的几率。
【在 l***o 的大作中提到】 : x/y的variance也太大(对每个obs, x和y不是1就是0.。。)
|
s*r 发帖数: 2757 | 13 不是说柯西分布var是无穷大么
【在 l***o 的大作中提到】 : bootstrap方法我试过,standard error太大, CI宽得像大峡谷。。。
|
j*****e 发帖数: 182 | 14 You are confusing the random variable with its parameter.
If your X and Y are binary, they can be modeled by bernoullie with parameter
p_x and p_y. So, you must be interested in estimating the confidence
interval for p_x/p_y. Note that X and Y are random variables, there is so
confidence interval regarding X/Y.
Denote the estimator of p_x is p_x_hat. That for p_y is p_y_hat.
If your sample size is large enough, the point estimator for p_x/p_y is p_x_
hat/p_y_hat. The SE for this estimator can be obtained using the delta
method and yes, you can plug in the correlation between p_x_hat and p_y_hat.
The CI for P_x/p_y is p_x_hat/p_y_hat+/-1.95*SE(p_x_hat/p_y_hat).
【在 l***o 的大作中提到】 : x/y的variance也太大(对每个obs, x和y不是1就是0.。。)
|
l***o 发帖数: 5337 | 15 对不起,我没说清楚。实际双方都不是binary的,而是连续的,但x取0的概率很大,我
说‘不是0就是1’是想说他们都在很小和很大直接跳跃,但这个说法其实非常
misleading,完全不对,特别道歉!
因为对每一个obs来说,Y和X的关系不稳定,就是Y和X的线性关系(和非线性关系)很
不明显。所以delta法则很难用,现在只想看看整个population里X的总量和Y的总量的
比值。。。
parameter
x_
hat.
【在 j*****e 的大作中提到】 : You are confusing the random variable with its parameter. : If your X and Y are binary, they can be modeled by bernoullie with parameter : p_x and p_y. So, you must be interested in estimating the confidence : interval for p_x/p_y. Note that X and Y are random variables, there is so : confidence interval regarding X/Y. : Denote the estimator of p_x is p_x_hat. That for p_y is p_y_hat. : If your sample size is large enough, the point estimator for p_x/p_y is p_x_ : hat/p_y_hat. The SE for this estimator can be obtained using the delta : method and yes, you can plug in the correlation between p_x_hat and p_y_hat. : The CI for P_x/p_y is p_x_hat/p_y_hat+/-1.95*SE(p_x_hat/p_y_hat).
|
c****y 发帖数: 94 | 16 jsdagre 其实已经把你的问题回答得很清楚了。你既然用X,Y 那他们就代表两个random
variable.你说已经有了confidence intervals about these two random variables.
其实就是 mean 和 standard deviation for p_x_hat and p_y_hat. 你最后想要的是
random variable Z='X/Y'的distribution. 这个没发直接得到,但delta method 完全
可以解决问题啊。
mean of Z=(p_x_hat/p_y_hat)
var of Z=1/((p_y_hat)^2)*var(X)+(p_x_hat)^2/((p_y_hat)^4)*var(Y)-2*p_x_hat/(
(p_y_hat)^3)*cov(X,Y)
如果理解有问题, 请看George Casella & Roger L. Berger 的 Statistical
Inference 的240页关于delta method。你的问题和第244页 example 5.5.27一模一样
。 |