a******n 发帖数: 11246 | 1 以前一直没这么思考过,最近突然想到。
假如有N个病人的数据。每个病人的数据有多个,比如大脑方面,心脏方面等等。
那我们分析大脑数据的时候,把这N个病人当成random sample;
分析心脏方面的时候,还是。
这其中似乎没有考虑到这些对应的数据来自同一个病人。
理想的状况是每个分类的数据都重新sampling N个病人。
但实际上通常这N个病人要被重复利用100多遍(上百种人体数据),
这样做,到底是为了节约成本而得到一些近似random samples,
还是这样本身就是满足model assumption的? |
l******n 发帖数: 9344 | 2 那是因为你假设这些病都是independent的
【在 a******n 的大作中提到】 : 以前一直没这么思考过,最近突然想到。 : 假如有N个病人的数据。每个病人的数据有多个,比如大脑方面,心脏方面等等。 : 那我们分析大脑数据的时候,把这N个病人当成random sample; : 分析心脏方面的时候,还是。 : 这其中似乎没有考虑到这些对应的数据来自同一个病人。 : 理想的状况是每个分类的数据都重新sampling N个病人。 : 但实际上通常这N个病人要被重复利用100多遍(上百种人体数据), : 这样做,到底是为了节约成本而得到一些近似random samples, : 还是这样本身就是满足model assumption的?
|
a******n 发帖数: 11246 | 3 你没有做过这方面的project吧。。。
从没有假设这些病的数据是independent的。任何report里你都不会看到这么说。
【在 l******n 的大作中提到】 : 那是因为你假设这些病都是independent的
|
l******n 发帖数: 9344 | 4 病人之间应该是独立的,同一个病人的不同病不是,但是你所的做法是默认不同病也是
独立的,除非有已知的那种有A必有B,有B必有A的情况.
我没做过生统方面的,听起来有意思,就跑来和你打酱油了
angelsun (安吉笋) 的大作中提到: 】 |
g********r 发帖数: 8017 | 5 简化了可以这么想,你有个二元分布。从里面随机取了100个样。如果单独考虑其中一
维,那么你的样本还是这个marginal分布的随机样本。
问题是,人体是非常高维的。一百个随机样本,可以保证在某些维度上,样本距离真实
分布的偏差是非常大的。虽然那个样本真的是个随机样本。
【在 a******n 的大作中提到】 : 以前一直没这么思考过,最近突然想到。 : 假如有N个病人的数据。每个病人的数据有多个,比如大脑方面,心脏方面等等。 : 那我们分析大脑数据的时候,把这N个病人当成random sample; : 分析心脏方面的时候,还是。 : 这其中似乎没有考虑到这些对应的数据来自同一个病人。 : 理想的状况是每个分类的数据都重新sampling N个病人。 : 但实际上通常这N个病人要被重复利用100多遍(上百种人体数据), : 这样做,到底是为了节约成本而得到一些近似random samples, : 还是这样本身就是满足model assumption的?
|
n**m 发帖数: 156 | 6 大脑数据和心脏数据有要求是uncorrelated的吧。如果是独立的研究,数据correlated
应该没有问题吧。
【在 a******n 的大作中提到】 : 以前一直没这么思考过,最近突然想到。 : 假如有N个病人的数据。每个病人的数据有多个,比如大脑方面,心脏方面等等。 : 那我们分析大脑数据的时候,把这N个病人当成random sample; : 分析心脏方面的时候,还是。 : 这其中似乎没有考虑到这些对应的数据来自同一个病人。 : 理想的状况是每个分类的数据都重新sampling N个病人。 : 但实际上通常这N个病人要被重复利用100多遍(上百种人体数据), : 这样做,到底是为了节约成本而得到一些近似random samples, : 还是这样本身就是满足model assumption的?
|
l*********s 发帖数: 5409 | 7 the co-variates are correlated, but which real projects aren't so?
【在 a******n 的大作中提到】 : 以前一直没这么思考过,最近突然想到。 : 假如有N个病人的数据。每个病人的数据有多个,比如大脑方面,心脏方面等等。 : 那我们分析大脑数据的时候,把这N个病人当成random sample; : 分析心脏方面的时候,还是。 : 这其中似乎没有考虑到这些对应的数据来自同一个病人。 : 理想的状况是每个分类的数据都重新sampling N个病人。 : 但实际上通常这N个病人要被重复利用100多遍(上百种人体数据), : 这样做,到底是为了节约成本而得到一些近似random samples, : 还是这样本身就是满足model assumption的?
|
s*****9 发帖数: 108 | 8 分析一个变量的时候,自然要考虑和他相关、影响它的变量了。没考虑进去的自然都假
设独立了。 |
s*r 发帖数: 2757 | 9 "那我们分析大脑数据的时候,把这N个病人当成random sample;分析心脏方面的时候
,还是。"
what is wrong with this.
你又不是同时分析大脑和心脏.
it may become a problem if you want to establish certain family wise type I
error across endpoint: one obvious issue is bonferroni may be over-
correction. on the other hand, if you really want to establish a
significance between one X variable and many endpoints, you should run a
repeated measure analysis.
【在 a******n 的大作中提到】 : 以前一直没这么思考过,最近突然想到。 : 假如有N个病人的数据。每个病人的数据有多个,比如大脑方面,心脏方面等等。 : 那我们分析大脑数据的时候,把这N个病人当成random sample; : 分析心脏方面的时候,还是。 : 这其中似乎没有考虑到这些对应的数据来自同一个病人。 : 理想的状况是每个分类的数据都重新sampling N个病人。 : 但实际上通常这N个病人要被重复利用100多遍(上百种人体数据), : 这样做,到底是为了节约成本而得到一些近似random samples, : 还是这样本身就是满足model assumption的?
|
A*******s 发帖数: 3942 | 10 是不是可以简化成这个问题?
X是某个病人的属性
Y1代表心脏病,Y2脑血管,Y3糖尿病,Y4肝病...
不同Y之间有correlation
你问的是这个意思么
不懂生统
不过感觉像以前学过的manova
【在 a******n 的大作中提到】 : 以前一直没这么思考过,最近突然想到。 : 假如有N个病人的数据。每个病人的数据有多个,比如大脑方面,心脏方面等等。 : 那我们分析大脑数据的时候,把这N个病人当成random sample; : 分析心脏方面的时候,还是。 : 这其中似乎没有考虑到这些对应的数据来自同一个病人。 : 理想的状况是每个分类的数据都重新sampling N个病人。 : 但实际上通常这N个病人要被重复利用100多遍(上百种人体数据), : 这样做,到底是为了节约成本而得到一些近似random samples, : 还是这样本身就是满足model assumption的?
|
c******n 发帖数: 492 | |
l****u 发帖数: 529 | 12 it is a observational experiment. Propensity score are usually used that is
P(x=1/y). |
C******a 发帖数: 49 | 13 没看懂楼主的问题。你是研究大脑还是心脏还是both? |