o******n 发帖数: 511 | 1 我们想把kinship matrix加到我们的model里,分析一些植物的genotype和它们的trait
的关系。
采样的时候,我们每个植物的genotype取了三个样,有27种植物的genotype,所以有81
个样品。
在把kinship放到模型里的R packages里,要求trait data matrix和kinship matrix要
有一样的size,请问我们这种81*n trait的trait data matrix和27*27的kinship
matrix怎么才能对应起来呢?取平均值肯定不是最优的办法。
谢谢! |
M*P 发帖数: 6456 | 2 balanced design, 我觉得取平均值是没问题的。
trait
81
★ 发自iPhone App: ChineseWeb 7.8
【在 o******n 的大作中提到】 : 我们想把kinship matrix加到我们的model里,分析一些植物的genotype和它们的trait : 的关系。 : 采样的时候,我们每个植物的genotype取了三个样,有27种植物的genotype,所以有81 : 个样品。 : 在把kinship放到模型里的R packages里,要求trait data matrix和kinship matrix要 : 有一样的size,请问我们这种81*n trait的trait data matrix和27*27的kinship : matrix怎么才能对应起来呢?取平均值肯定不是最优的办法。 : 谢谢!
|
o******n 发帖数: 511 | 3 谢谢你的回复。
那如果不是balanced design请问怎么处理好?
比如实际中,有的样品测序没有出来,所以不是每个genotype都有3个replicates。
gwas里面每个genotype应该也会测几个replicate的吧,而且也不一定是balanced
design,他们是怎么把不一样大的trait data matrix和kinship matrix联系起来的呀?
也许做gwas的人不会遇到我这个问题吧,他们的每个replicates也都genotype过,有
SNP data,所以trait data和kinship的矩阵大小一致。可是我们没有每株植物的SNP
data。
我这个问题看来真的不好办…… :-( |
M*P 发帖数: 6456 | 4 you can do a majority vote and see how it goes.
in your case, genotype is the control variable, which is not assumed to be
random variable in most situations. If anyone knows how to make both
genotype and phenotype as random variable, I would like to learn how to do
the analysis.
呀?
【在 o******n 的大作中提到】 : 谢谢你的回复。 : 那如果不是balanced design请问怎么处理好? : 比如实际中,有的样品测序没有出来,所以不是每个genotype都有3个replicates。 : gwas里面每个genotype应该也会测几个replicate的吧,而且也不一定是balanced : design,他们是怎么把不一样大的trait data matrix和kinship matrix联系起来的呀? : 也许做gwas的人不会遇到我这个问题吧,他们的每个replicates也都genotype过,有 : SNP data,所以trait data和kinship的矩阵大小一致。可是我们没有每株植物的SNP : data。 : 我这个问题看来真的不好办…… :-(
|
o******n 发帖数: 511 | 5 谢谢你的回复。
如果我们不加kinship到model里,那么genotype就是一个有27个level的factor,R会
assume这些level是一样的,但其实它们之间的genetic distance并不一样,所以我们
想把这个信息加到model里。
让我困惑的就是怎么加。我想到一个办法就是把每个plant genotype跟其它所有
genotype的total genetic distance作为一个新的covariate放到model里。但我又觉得
,这个covariate和genotype不是collinear的吗?
plant breeding的人有时会把kinship matrix加到model里做association analysis。
不过我们的trait不是传统意义上的phenotype,也没有每株植物的SNP data,所以很多
软件/package不能用……
【在 M*P 的大作中提到】 : you can do a majority vote and see how it goes. : in your case, genotype is the control variable, which is not assumed to be : random variable in most situations. If anyone knows how to make both : genotype and phenotype as random variable, I would like to learn how to do : the analysis. : : 呀?
|
M*P 发帖数: 6456 | 6 you think this as a two step process. First you get the best genotype
estimation you can get using 3 replicates for each species. For the second
step, you forget about the errors in the genotype and assume they are 100%
correct. Then you do the linear mixed model for whatever your analysis is.
The kinship is used as random effect to control for the relateness of the
species.
【在 o******n 的大作中提到】 : 谢谢你的回复。 : 如果我们不加kinship到model里,那么genotype就是一个有27个level的factor,R会 : assume这些level是一样的,但其实它们之间的genetic distance并不一样,所以我们 : 想把这个信息加到model里。 : 让我困惑的就是怎么加。我想到一个办法就是把每个plant genotype跟其它所有 : genotype的total genetic distance作为一个新的covariate放到model里。但我又觉得 : ,这个covariate和genotype不是collinear的吗? : plant breeding的人有时会把kinship matrix加到model里做association analysis。 : 不过我们的trait不是传统意义上的phenotype,也没有每株植物的SNP data,所以很多 : 软件/package不能用……
|
o******n 发帖数: 511 | 7 谢谢你哦。我想你的意思是,把第一步算出的genotype的coefficients作为dependent
variable用kinship来model,对吗?那第二步的什么结果可以回答plant genotype和
trait的关系吗?
我们还知道有significant genotype by environment interaction,所以第一步的
model里面也会加入E和GxE,所以GxE也会被genotype relatedness影响。
【在 M*P 的大作中提到】 : you think this as a two step process. First you get the best genotype : estimation you can get using 3 replicates for each species. For the second : step, you forget about the errors in the genotype and assume they are 100% : correct. Then you do the linear mixed model for whatever your analysis is. : The kinship is used as random effect to control for the relateness of the : species.
|
o******n 发帖数: 511 | 8 @MHP:
我下午查文献和R help list的时候看到有人跟你类似的方法了。
我刚想出来另外一个办法了!
我把那个kinship matrix inflate到trait data的size就可以了,然后随便什么可以
take kinship or correlation matrix的package都能用了,哈哈!而且这样比取均值
要更make sense。 |