|
c***y 发帖数: 615 | 2 只有一个genelist, 想看的是两两基因之间表达变化是否有相关性 |
|
e*********6 发帖数: 3453 | 3 对这种correlation,不都是2个vector直接进行计算吗,比如我们算X1和X2直接的
correlation,X1和X2要是一样的大小。我问的对你的情况,X1和X2的size是多大? |
|
|
|
c***y 发帖数: 615 | 6 其实现在想看的到是这些是1的,也许是一个基因表达module |
|
d*****r 发帖数: 1635 | 7 这边连Operations Management 这种实用专业都搞得这么学术化,回国的话,什么都干
不了(出了继续发理论文章)。
其实,同OM 挺近的IE (Industrial Engineering)就很实用。Gatech的IE 牛人Mark
L. Spearman 就自己办了一家管理咨询公司,专门为企业服务。
什么都是工科化后就实用了。 |
|
s********o 发帖数: 3319 | 8 我知道你有很多马甲,象在医疗实践版的spearman也是你。还有各种各样扮演不同身份
的马甲。
其实很多人都知道你的真实姓名。听我一句劝,别自作聪明,肆无忌惮地顶着马甲捣乱
。 |
|
r******s 发帖数: 2155 | 9 factor analysis tradition to SEM are mostly fueled by psycholigists' research
starting from Spearman, Thurston, Joreskog, Bentler, Browne, etc.
that
last |
|
A***A 发帖数: 98 | 10 That is correct.
Spearman and his g-factor theory was really invented before its time. His
1904 paper is very modern in a lot of ways.
Karl Joreskog and Michael Browne are strictly speaking statisticians working
on models used in psychological settings. Of course they've made great
contributions to the field.
There is a clear influence from DN Lawley and Sir Godfrey Thomson on Karl
Joreskog for his interest in factor analysis. On the other hand, Joreskog's
advisor, Herman Wold, is also instru |
|
|
A***A 发帖数: 98 | 12 ape同学好,前段时间忙死了。 John Horn 光看上去就是挺牛的,白胡子一大把。
说个有意思的,去年我们造那个factor analysis family tree 的时候,记不得是Karl
Joreskog (of the Lisrel fame) 还是 Michael Browne 说
这个tree上面有很多"bastards"
(原话),就好比他们自己,不是Spearman或者Thurstone的师承,而是先搞数理统计,后
对psychometrics感兴趣。
已经 |
|
q****3 发帖数: 2223 | 13 焦虑自评量表(SAS)
2012-06-07 23:11:03 来源: 评论:0 点击:
519
填表注意事项: 下面有二十条文字,请仔细阅读每一条,把意思弄明白,然后根据您
最近一周的实际感觉,选择等级:A没有或很少时间;B少部分时间;C相当多时间;D绝
大部分时间或全部时间。1.我觉得比平常容易紧...
填表注意事项:
下面有二十条文字,请仔细阅读每一条,把意思弄
明白,然后根据您最近一周的实际感觉,选择等级:A没有或很少时间;B少部分时间;
C相当多时间;D绝大部分时间或全部时间。
1.我觉得比平常容易紧张或着急
2.我无缘无故地感到害怕 ... 阅读全帖 |
|
c******s 发帖数: 90 | 14 Essentially the correlated bi-variate uniforms generated
by the second method can be viewed as a Gaussian copula with marginal
uniform distribution. You can calculate the spearman's rho, which
is given by that formula. |
|
x*****n 发帖数: 178 | 15 这个famliy-wise error很高啊 不过有些人不care |
|
j*********r 发帖数: 200 | 16 用SPSS做一个PROJECT, 期望得到两个变量的R SQUARE的值高于0.7. 但实际上,只有0.
03.
去掉一些OUTLIERS后, 发现R SQUARE的值不升反而降到0.0008. 不明白是怎么回事,难
道去掉OUTLIERS的方法错了么? 怎么样才能提高R SQUARE 和 SPEARMAN CORRE
COEFFIENT 的值呢? 多谢! |
|
x***x 发帖数: 3401 | 17 (1)的话, 你做一个X1=X2-X9的backward elimination的linear model看看吧. 假设
survey的问题设计是好的, X2-X9互相应该不是confounder. 最好不要一股脑把所有可
能的two-way interaction都放进去, 那样model太大. 选一些有充分理由相信
interaction存照的放进去.
(2)就用spearman correlation coefficient就可以了吧. |
|
s*****a 发帖数: 310 | 18 大家好,我有两组数据,一组是GPA, 里面只包括1,2,2.5,3,3.5,4.另一组数据是
学生的学习时间。因为时间是以0-2hours, 2-4hour,4-6hours等出现,我就把他们都转
换成了1,2,3,4分别对应这些区间,现在我想计算这两组数据的correlation, 请问
大家哪一种方法最合适,Pearson, spearman,or other?谢谢大家, |
|
A*******s 发帖数: 3942 | 19 ordinal data-->spearman |
|
s*****a 发帖数: 310 | 20 谢谢您,因为我有上百组数据,所以在排序的时候,就重复出现很多的数,比如1,1,
1,1,1,2,2,2,2,2,2,2.5,2.5,2.5.....,我应该怎么排这些序呢,相等的
数字用不同的序号还是取他们序号的平均值呢?还有,spearman 是否只用于没有重复
的数字的情况?谢谢。急等 |
|
c****u 发帖数: 243 | 21 Using pearson's coefficient to test independence is pretty common in
statistics. I think it is more reasonable than simply assuming they are bi-
tri-variate normal as you did.
If you think the pearson's coefficient is not a robust measure, you may try
the spearman's rho, which is a nonparametric approach. |
|
|
D*********2 发帖数: 535 | 23 这里X和Y都是直线方程式,式中的变量可调换, 但如果这样做, X与Y的表达失去了其本
身意义.
这句没看懂,zkss? |
|
d*********k 发帖数: 1239 | 24 correlation 我试了看不出来什么东西,只能看出来它们比较小
我用spearman cor,是medical的数据 |
|
h******y 发帖数: 3501 | 25 spearman's correlation? |
|
P****D 发帖数: 11146 | 26 Spearman
我都尽量不用Pearson。 |
|
c*****t 发帖数: 1712 | 27
spearman 应该是 non-parametric 版本的 pearson |
|
T*******I 发帖数: 5138 | 28 Spearman相关的中文翻译是等级相关,即衡量两个等级测量的随机变量间的相关性,而
等级测量一般不认为是连续测量,而是离散测量。 |
|
z**********i 发帖数: 12276 | 29 OUTCOME: BMI
PREDICTOR: QUESTION1, QUESTION2, QUESTION5, QUESTION6...
所有的PREDICTORS是ORDIANL VARIABLE.
我想分别TEST OUTCOME和每一个PREDICTOR的CORRELATION.
我用了2个方法:
1.
PROC CORR SPEARMAN;
VAR BMI QUESTION1n QUESTION2n...;
RUN;
生成一个CORRELATION TABLE.
2. ANOVA
分别把每个PREDICTOR和BMI放到MODEL里,这一步,我不是很确定.
proc glm data = DATA;
class QUESTION1;
model BMI = QUESTION1;
meansQUESTION1;
run;
quit;
最终,是要建个MIXED MODEL.现在是筛选可用的PREDICTORS.
多谢!! |
|
p********a 发帖数: 5352 | 30 ☆─────────────────────────────────────☆
zhongdianshi (brb) 于 (Mon Aug 29 09:50:26 2011, 美东) 提到:
OUTCOME: BMI
PREDICTOR: QUESTION1, QUESTION2, QUESTION5, QUESTION6...
所有的PREDICTORS是ORDIANL VARIABLE.
我想分别TEST OUTCOME和每一个PREDICTOR的CORRELATION.
我用了2个方法:
1.
PROC CORR SPEARMAN;
VAR BMI QUESTION1n QUESTION2n...;
RUN;
生成一个CORRELATION TABLE.
2. ANOVA
分别把每个PREDICTOR和BMI放到MODEL里,这一步,我不是很确定.
proc glm data = DATA;
class QUESTION1;
model BMI = QUESTION1;
meansQUESTION1;
run;
quit;
最终,是要建个MIXED MOD... 阅读全帖 |
|
H*******s 发帖数: 382 | 31 谢谢,查过了,pearson spearman都少于0.5 |
|
x*******u 发帖数: 500 | 32 问题1, A 是binary 变量。 B 是 ordinal 变量, 5个level. C是一个continuous的值
。C 总共有10个值. 想看C 的值 随着 B 的变大, 在不同的A level中, 有没有一个
trend. 请问这个能用什么test?
问题2, 没有A变量, C 只有5个值. 想看 C 的值 随着 B 的变大, 有没有一个trend.
请问这个能用什么test? 觉得能用spearman correlation, 但是不是很确定.
谢谢了. |
|
u****m 发帖数: 118 | 33 Hi
I'm not a stat expert so my question may be really naive.
Is it possible to conduct a correlation analysis for ONE person? The
unit of analysis (case) however is not a person but an instance that occurs
at a time.
Below is a mock up data for ONE person who has different values for
variable A and variable B for each week. I want to test if variable A and
Variable B are correlated across weeks for this (ONE) person?
CASES, | Variable A, | Variable B
week1, | 2, | 3
w... 阅读全帖 |
|
s******h 发帖数: 539 | 34 你这个问题其实很好。对于Pearson Correlation, 做一般的monotone transformation
是会影响的。 你可以这样想,做transformation之前Pearson Correlation ~ Corr(X,
Y), 做了之后,say f, Pearson Correlation ~ Corr(f(X), f(Y)),你可以推推看这
两者差别会有多大。
其实也有其他的correlation measurement是independent of monotone
transformation的, e.g.
http://en.wikipedia.org/wiki/Spearman's_rank_correlation_c |
|
G****g 发帖数: 542 | 35 如果A和B非线性相关,他们还有correlation吗?
Yes
比如说 A= B/(1-B),然后直接测A和B
的correlation, 会不会得出一个很小的值?
Might be, but you can try to use nonparametric test, Spearman for example.
另外"r2=0.32,P=ns"里的 P=ns 是啥意思?
non-significant |
|
P****D 发帖数: 11146 | 36 妾晕……二楼要砍掉重练!!!把基本概念搞清楚!!!
correlation的定义:
http://en.wikipedia.org/wiki/Correlation
凡是不独立的,就叫有correlation,不管关系是线性还是非线性。平时说的线性关系
,那是Pearson's correlation,只是correlation的一种。如果用Spearman's测量楼主
的A和B,会得出rho=1。除了这两种方法之外,也还有其他描述correlation的tests。
至于“r2=0.32,P=ns”,ns=not significant,这么写的人也该砍掉。现在通行的方法
是不管p值是否显著,都要报告具体数字。楼主千万别学他。 |
|
P****D 发帖数: 11146 | 37 确实和B的值有关。我习惯性地把B限制在小于1了……不好意思。
只要B限制在一直大于1,或是一直小于1,那这个函数就是单调的。单调的,又能完美
拟合,Spearman's rho就是1了。跨越1就不一样了。 |
|
P****D 发帖数: 11146 | 38 这个有若干种方法,wikipedia给了三种。
http://en.wikipedia.org/wiki/Spearman%27s_rank_correlation_coef
Determining significance
One approach to testing whether an observed value of ρ is significantly
different from zero (r will always maintain −1 ≤ r ≤ 1) is to
calculate the probability that it would be greater than or equal to the
observed r, given the null hypothesis, by using a permutation test.
Another approach parallels the use of the Fisher transformation in the case
of the Pearson product-moment c... 阅读全帖 |
|
j****o 发帖数: 573 | 39 non-parametric methods?
Spearman’s R
Kendall’s tau |
|
t*****w 发帖数: 254 | 40 I still believe that it is valid var(computer - human) = var(human) + var(
computer).
even if you have 500 samples from different populations, you can still
assume there is homogeneity of variance for all populations. Otherwise it is
meaningless to apply the variance from data (3) to data (1).
Do Pearson or Spearman correlation between data (1) and (2).
Do non-parametirc Wilcoxon comparison between data (1) and (2).
我一重新看一下,你刚才说的paired t test , 但是发现一个小问题,这个方法应该是
对一个sample 的随机读数有作用的吧,我这个问题是每个试件其... 阅读全帖 |
|
t*****w 发帖数: 254 | 41 When I had my job interview, they always tested my SAS skill.However I use R
all the time. To help your preparation, read my R codes to see how much you
can understand it.
%in%
?keyword
a<-matrix(0,nrow=3,ncol=3,byrow=T)
a1 <- a1/(t(a1)%*%spooled%*%a1)^.5 #standadization in discrim
a1<- a>=2; a[a1]
abline(h = -1:5, v = -2:3, col = "lightgray", lty=3)
abline(h=0, v=0, col = "gray60")
abs(r2[i])>r0
aggregate(iris[,1:4], list(iris$Species), mean)
AND: &; OR: |; NOT: !
anova(lm(data1[,3]~data1[,1... 阅读全帖 |
|
t*******0 发帖数: 64 | 42 大概有30-60个病人如下的data:
第一组是patient variable(demographics: age, race, etc)(5-10 variables)
第二组是patient clinical diagnosis 结果(10 variables: continuous or ordinal
,从不同的方面对病人的诊断)
第三组是一种新的检查仪器的结果(about 300 variables)
想知道:
1. 第二,三组之间的correlation, 由于变量太多, 传统的pearson/spearman
correlation不好用
2. 第三组数据能不能 predict 第二组数据: clinical diagnosis是gold standard,
是否
patient 检查仪器的结果能predict clinical diagnosis的结果, 要对每个clinical
variable做regression(clinical variable is dependent variable, 检查仪器的
variables as independent var... 阅读全帖 |
|
i**z 发帖数: 194 | 43 1, 你是要验证 parameter normal, 还是那些 250 data points normal?
2, correlation 和 dependency 是两个概念. 你要看 data 是 continuous 的还是
discrete, 如果是 continuous 用 pearson, 如果是 discrete 用 spearman. |
|
a*****i 发帖数: 1045 | 44 第一年,完全没什么概念呢。已经开始选择论文题目了。现在有几个option,不知道有
没有好心人可以帮忙看看哪些方向比较好,或者对将来工作会有帮助。
自己之前定了跟statistical process control 有关的方向。但不怎么样。
1. Title : A comparison of different statistical process monitoring schemes
on real life data (这个是关于statistical process control的)
It is often desirable to provide online monitoring for industrial or
agricultural processes. Faced with the task of performing such monitoring,
practitioner will often choose to apply a control chart. However, there many
options available, and it i... 阅读全帖 |
|
T*******I 发帖数: 5138 | 45 In my opinion, Pearson's correlation coefficient does work for your case.
You also can try Spearman's correlation coefficient, which is said to be
used with categorically count data. But I believe for your case, both should
be very close to each other. |
|
J******m 发帖数: 97 | 46 补充一点: 可以把不相关的(Irrelevant )的变量去掉, 用proc corr, 得到一个图
叫scatter plots of ranks of Spearman VS Hoeffding, 然后做 empirical
logit plot对个别可疑变量。欢迎高手指正!谢谢 |
|
E**********e 发帖数: 1736 | 47 我现在在一个小的私人公司做risk modeling才半年多。前半年觉得自己做得很不错。
可是现在越觉得有很多问题很疑惑,现在抛出来,请有经验的大侠指导。
公司是做loan lending的小公司,比较新, 积累的charge off 数据4000不到, 这个
跟大银行动辄一两个million 的数据不一样。 modeling的数据不是很好。我就不自爆
奇丑了,主要表现是training 和test的AUC差别很大, 有很大overfitting。
现在问题来了。假设数据分成三个部分,数据一是training, 数据二是test, 数据三
是holdout。holdout 类似于future data, 用来测试最后model 表现。所以这部分数
据只能在建模完后才拿出来。建模前是绝对不是偷看,防止数据“泄露”到modeling
过程。
我的主要问题是怎么预先选初始变量。我原先理解就是用数据一和二,初选个100左右
的变量,很多modeling的书谈到bivariate analysis,算pvalue, spearman
correlation,还有是么clustering,等等。然... 阅读全帖 |
|
A*******s 发帖数: 9638 | 48 谢谢。
spearman, 请把你骂人的贴delete, 否则我封你, 说一不二。 |
|
s*****c 发帖数: 25 | 49 我也是学统计出身,貌似这个就是一个correlation testing的问题。。。无非pearson
/spearman/kendall这几个test吧,具体哪个更适用要看数据了。
名字术语倒也不是没有用,只是有点用牛刀杀鸡的感觉。。。 |
|
s*****c 发帖数: 25 | 50 我也是学统计出身,貌似这个就是一个correlation testing的问题。。。无非pearson
/spearman/kendall这几个test吧,具体哪个更适用要看数据了。
名字术语倒也不是没有用,只是有点用牛刀杀鸡的感觉。。。 |
|