由买买提看人间百态

topics

全部话题 - 话题: correlation
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
p*********w
发帖数: 606
1
correlation本来就是表示线性相似度的度量,如果相似度不大的话,把rho作为参数得
到的函数效果也不会好。
如果仅仅是想用B来回归A,可以试试machine learning,训练个分类器出来看看效果就
行了
s*******g
发帖数: 2
2
来自主题: Statistics版 - 请教工作中遇到的correlation问题
工作上遇见这样一个问题,大家能帮我看看么?
X1-X10 10 variables
X1:overall survey score, it can be 1 - 10 , integer
X2 - X9: also 1 - 10, detail survey scores
X10 is a numerical variable, range 0 - 100
我想知道,
1) how to rank X2 - X9? X1? 那些是对X1最重要的影响因素?And any interaction
among them?
2) I want to know if X10 is correlated with X1
我应该怎么解决呢?我可以用SAS或者EXCEL。
谢谢大家.
x***x
发帖数: 3401
3
来自主题: Statistics版 - 请教工作中遇到的correlation问题
(1)的话, 你做一个X1=X2-X9的backward elimination的linear model看看吧. 假设
survey的问题设计是好的, X2-X9互相应该不是confounder. 最好不要一股脑把所有可
能的two-way interaction都放进去, 那样model太大. 选一些有充分理由相信
interaction存照的放进去.
(2)就用spearman correlation coefficient就可以了吧.
s*****a
发帖数: 310
4
大家好,我有两组数据,一组是GPA, 里面只包括1,2,2.5,3,3.5,4.另一组数据是
学生的学习时间。因为时间是以0-2hours, 2-4hour,4-6hours等出现,我就把他们都转
换成了1,2,3,4分别对应这些区间,现在我想计算这两组数据的correlation, 请问
大家哪一种方法最合适,Pearson, spearman,or other?谢谢大家,
b**********i
发帖数: 1059
5
平时都用R,这回需要用到SAS,大虾指导一二?X1 to x4,one common correlation
coefficient.
d******o
发帖数: 59
6
do you want to get the correlations among variables or diagnose
multicollinearity in regression?
If the first, use proc corr.
if second, use vif in proc glm
q**j
发帖数: 10612
7
好像 correlation (叫r) 的分布是t distribution,standard deviation是 sqrt((1-r
^2)/(n-2)),当然假设x,y都是normal的。请问哪个地方有这个结论的推导?多谢了。
b*****o
发帖数: 482
8
如果B C D E F G H两两highly correlated的话 只放一个进去
具体放哪个进去 最好看哪个variable最好解释model
s********9
发帖数: 74
9
If there are independet variables like income, food cost, house renting/
payment, education cost ...... They are correlated, but each of them is
important. If each of them significant in univariable analysis, but only
income is significant in multivariable analysis. What could be the
conclusion for the impact factors for the outcome?
s********9
发帖数: 74
10
Thank you!
Statistically, they are all correlated, but each of them is important.
s**f
发帖数: 365
11
有没有人算过survey data的correlation?
m****r
发帖数: 59
12
来自主题: Statistics版 - 请教一个关于correlation的问题
请教统计高人:
计算两个time series的correlation,需要要求这两个time series 都normally
distributed的吗?volatility clustering, heteroskedasticity, time-
dependence 这些是不是问题?需要做Dickie Fuller之类的测试并去除trend和
autoregressive lag吗?
多谢多谢!!!
D******n
发帖数: 2836
13
correlation coefficient.
Do u mean it has normality assumption?
s****e
发帖数: 1180
14
完全和normality无关,就是两个random variables,分布类型完全不同,也都不是
normally distributed, 一个来自poisson分布,一个来自binomial分布,他们之间的
correlation怎么刻画?
b*****n
发帖数: 685
15
似乎可以假定各自的latent variable是normal且correlated
a****m
发帖数: 693
16
不知道你说的意思? 如果两个不同的distribution, 你是怎么算covarance, if
covariance is not calculatable, correlation would be no where to go.
entropy 是一个比较两个distribution相似或者差别的一种方法。
D*********2
发帖数: 535
17
来自主题: Statistics版 - 求助:俩曲线间correlation
就是longitudinal作出俩变量的俩population curve,这俩curve长的很“倒影”,一个
increase,一个decrease的。有方法measure这个correlation不?
有大师做过类似的不?
谢谢谢谢
c*********t
发帖数: 340
18
来自主题: Statistics版 - 求助:俩曲线间correlation
cross correlation?
D*********2
发帖数: 535
19
来自主题: Statistics版 - 求助:俩曲线间correlation
我不算lag,那俩curve也不是periodic的,cross correlation咋讲?zkss
谢谢谢谢。
a********s
发帖数: 188
20
yes, it is the correlation between random intercept and time.
a********s
发帖数: 188
21
The negative correlation means large intercept has smaller slope of time, in
your case.
S******J
发帖数: 30
22
I am not familiar with gls but are you sure it is the correlation between
random, not fixed, intercept and time?
M******8
发帖数: 22
23
遇到点问题,问问版上的牛牛们~~
我在算two sample correlation的时候,用了Kendall's tau and Spearman's rho.
但是最后算出来的结果却是不一样的。Kendall's tau的结果是 p<0.05,但是Spearman'
s rho的p >0.05。这是为什么呢?
谢谢啦~~
t**u
发帖数: 1572
24
巨包求经典电子书:
Rank Correlation Methods
by Kendall
M*P
发帖数: 6456
25
来自主题: Statistics版 - small sample correlation
一般来说pearson correlation都是需要30个以上的样本。我现在样本更少,有什么已
知的处理方法么?
谢谢
h******y
发帖数: 3501
26
来自主题: Statistics版 - small sample correlation
spearman's correlation?
P*******s
发帖数: 24
27
来自主题: Statistics版 - small sample correlation
PERCENTAGE BEND CORRELATION
http://www.itl.nist.gov/div898/software/dataplot/refman2/auxill
c*****t
发帖数: 1712
28
来自主题: Statistics版 - Correlation between 2 variables
怎么检验是否相关?是两个continuous的。 其中一个接近normal,另外一个left
skewed.
用pearson correlation? linear regression? or?
d**********o
发帖数: 1321
29
来自主题: Statistics版 - Correlation between 2 variables
可以试 pearson correlation. 同一知半解中,求解--
l*u
发帖数: 114
30
来自主题: Statistics版 - Correlation between 2 variables
原因是什么呢?
一直以为correlation就是\sum(xi-xbar)(yi-ybar)/... 就行了呢, 哎
c*****t
发帖数: 1712
31
来自主题: Statistics版 - Correlation between 2 variables

谢谢哈。
还有个问题,我这两个变量,一个范围是 0-40000, 另一个是 0-0.15.
算correlation前,用不用做啥transformation?
l******n
发帖数: 9344
32
please read correlation definition ...
l*********s
发帖数: 5409
33
Down to the bottom, pairwise correlation corresponds to the univariate
regression model.
j*****l
发帖数: 73
34
想生成correlated multivariate lognormal distribution,因变量间的相关系数为0.
5,如何实现?
R中有个package“compositions”中有rlnorm.rplus()函数可生成多元对数正态分布,
但不能控制相关系数,不知哪位高手能帮忙生成出来,3个包子奉上。
o****o
发帖数: 8077
35
pearson correlation is very data specific and can trap you into faked beliefs.
****************
try this code:
set.seed(1)
x<-1:100
y<-0.2*x+rnorm(length(x))*sqrt(var(x))
cor(x,y)
plot(x,y)
x2<-1:100
y2<-900+1.2*x+rnorm(length(x))*sqrt(var(x))
cor(x2,y2)
zx<-c(x,x2)
zy<-c(y,y2)
p********r
发帖数: 1465
36
请假大家:
例如数据是这样的,
部门 员工 X Y
M 1 3.4 5
M 2 4.5 8
N 3 2.3 9
...
按部门归类的话,
部门 X Y
M 7.9 13
N 2.3 9
...
如果要对X和Y做correlation/regression等分析,在员工层面做和在部门层面做得到的
结果会一样?还是近似?还是完全不同呢?
还是说要取决于数据的特点?
谢谢
p********r
发帖数: 1465
37
是不是他们的distribution都差不多的话,那么correlation结果也会近似?

could share some thoughts!
c****r
发帖数: 576
38
看了访谈,貌似就是可计算非线性相关系数,这得是多少年前的冷饭!尼玛,作者看上
去都牛逼哄哄的。内行人来点评一下?
==========
原文:
Detecting Novel Associations in Large Data Sets
http://www.sciencemag.org/content/334/6062/1518.abstract
编辑推荐:
A Correlation for the 21st Century
http://www.sciencemag.org/content/334/6062/1502.short
访谈:
http://www.nature.com/nbt/journal/v30/n4/full/nbt.2182.html
其他评论:
http://iew3.technion.ac.il/~gorfinm/files/science6.pdf
更多的评论:
http://comments.sciencemag.org/content/10.1126/science.1205438
Y*****o
发帖数: 1173
39
来自主题: Statistics版 - Compare two correlation coefficients
I have variable A, B, C, and need to compare correlation coefficients A&B
and A&C.
I wonder which method I can use?
This seems to be an extremely simple question, but the Fisher z-
transformation only works when these two coefficients are independent.
Thanks a lot.
N******n
发帖数: 3003
40
来自主题: Statistics版 - Residual and Partial Correlation

show
你也可以simulate outcome=beta1*var1+beta2*var2, beta1 and beta2 can be
assumed as their corresponding partial correlation
D******n
发帖数: 2836
41
correlation between x1 and x2
try y=x1+x2+x1*x2

y~
x1
f**********r
发帖数: 120
42
来自主题: Statistics版 - 关于correlation coefficient 的几何解释
wiki 上解释说 correlation coefficient 是 y对x 和 x 对y的线性拟合的两条直线的
cos 值。 see the Geometric interpretation part of the wiki page linked.
http://en.wikipedia.org/wiki/Pearson_product-moment_correlation
可是,我怎么推导都觉得这个关系不成立。举个例子,上述关系也不成立, 除非当x和
y 完全相关,两条直线重合。求证一下wiki 上的这个解释是不是错的?有没有相关的
几何解释? 谢谢!
u***8
发帖数: 29
43
用pearson correlation比较两组数据的相关性,最后r=0.8, p<0.05.
问题是现在要画散点图,有几个数据太大了,如果都画上去,其他数据就都聚在一起了
。可不可以log10 transfer 以后,再画散点图来显示两组数据的相关性(假设数据过
原点)?
统计基础不好,还请大家帮帮忙,谢谢阿~~~
z**********i
发帖数: 12276
44
把数据调整得均匀一点再看correlation, 更客观一些。记得上课的时候讲leverage,
好像就是这个情况。
p****x
发帖数: 1346
45
Y is the customer's credit score, X is the input variables to calculate
customer's credit score, such as income, age, years of credit history.
There are two models to calculate Y, Y1 and Y2 are credit score result of
two models.
So, same input variables, but different models to get different result of Y1
and Y2. Which model is better?
Should I use correlation to work on that?
Thanks so much!
b*********n
发帖数: 1938
46
帮你翻译一下,
model selection.
既然选出来的变量都一样,我想应该是 correlation大的好点。
当然也看x之间有没有共线性。
当然还要看是不是有更好的非linear model。
当然还要看你的model是不是robust.
既然你两个model用同样的一组x,系数却不一样,我猜想两个回归方法应该不一样吧。

Y1
l******a
发帖数: 58
47
你说的两个model算出来Y1和Y2 还有不同的R-square, 那肯定不是完全线性了吧
那R-square,correlation只能说明这个模型离线性有多远
看模型好不好不是应该用实际数据来回归分析吗
这只是菜鸟的想法,要大侠来分析一下
t****r
发帖数: 702
48
来自主题: Statistics版 - 发包子求问,correlation
it's possible. Correlation only measures linear relationship between A and B.

B
l******n
发帖数: 9344
49
来自主题: Statistics版 - 发包子求问,correlation

~~~~~~~~~~~~~~~~~~~~~~?这个没看明白,为什么是1?lz那个也和B的值有关吧,基本
就是taylor展开的一次项
除了这两种方法之外,也还有其他描述correlation的tests。
L*****2
发帖数: 66
50
来自主题: Statistics版 - correlated variables in the model
The model has three variables X, Y and Z, where Z=Y/X. The linear
correlations among X, Y and Z are low. Is this model OK? Any comments are
highly appreciated!
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)