M****7 发帖数: 214 | 1 最近为文章补充数据开始做基因组DNA methylation分析,问一些白痴问题吧。
我们已经从别人文章里面retrieve了感兴趣的区域所有C的有methylation的sequencing
read count和total reads count,是否mC%就是等于 mC reads数目 / 总reads数吗
?
我们想比较ChIP-Seq peak和没有蛋白binding地方的methylation有没有差异,如何计
算peak里面的methylation比例?还有看别人文章里面都能绘制一个分布曲线,一般用
什么软件可以做?
有没有大牛可以推荐一下科普读物,最好可以速成。非常感谢。
节日快乐! | n******7 发帖数: 12463 | 2 不是
因为一个reads上可能有多个CpG 位点
特别是CpG island区域 | h*********9 发帖数: 35 | 3 会R不?要会的话我可以送的code给你。
sequencing
【在 M****7 的大作中提到】 : 最近为文章补充数据开始做基因组DNA methylation分析,问一些白痴问题吧。 : 我们已经从别人文章里面retrieve了感兴趣的区域所有C的有methylation的sequencing : read count和total reads count,是否mC%就是等于 mC reads数目 / 总reads数吗 : ? : 我们想比较ChIP-Seq peak和没有蛋白binding地方的methylation有没有差异,如何计 : 算peak里面的methylation比例?还有看别人文章里面都能绘制一个分布曲线,一般用 : 什么软件可以做? : 有没有大牛可以推荐一下科普读物,最好可以速成。非常感谢。 : 节日快乐!
| a******r 发帖数: 786 | 4 纯算methyl 的话,我觉得R 的methylKit 不错,Biseq也可以
我不太懂你要在ChIP的算methylation的意思
前几年有个几个组 ChIP做完之后的DNA 再bisulfite 测序,量很低但是做出来了
这个technique 叫 ChIP-BS-seq
你要是两个样品一个做ChIP 另一个做 methylation 会有 bias | h*********9 发帖数: 35 | 5 这些分分析定制的东西比较多,我还不知道那些软件可以,不过用R的话,半天就可以
搞定。
基本办法是把 ChIP-Seq peak region 和 methylated sites 都编码成 R GRange
objects, 然后用 R 提供的 operations on GRanges , find and count overlaps。
如果要计算 differentially methylated sites, you can use beta-binomial
regression. If you want to identify differentially methylated regions,
hidden Markov model is a good option.
最近写了一个 regression hidden Markov model for methylation data, 还没来及测
试。
Below is some sample code:
library(GenomicRanges)
library(GenomicFeatures)
library(data.table)
library(AnnotationDbi)
## save your peak regions in a bed file and encode them as GRanges
peak.df <- read.table("peak_regoins.bed", header = FALSE,stringsAsFactors=F)
peak <- GRanges(seqnames = peak.df$V1, ranges = IRanges(start = peak.df$V2,
end = peak.df$V3), ids = peak.df$V4)
## encode methylated sites as GRanges
meth.gr=GRanges(seqnames=meth.ratio$chr,ranges=IRanges(start=meth.ratio$
start, end=meth.ratio$end),
strand=meth.ratio$strand,
id=meth.ratio$id,
data.frame(meth.ratio[,6:ncol(meth.ratio)])
)
## find overlaps
mat=as.matrix( findOverlaps(peak,meth.gr) )
## Use data.table for faster computing
DT=data.table(id=names(regions)[mat[,1]],meth.ratio[mat[,2],c(6,7)])
setkey(DT,id)
## The next step is to conduct whatever statistical tests you need.
## Say, beta-binomial regression and hidden Markov model.
sequencing
【在 M****7 的大作中提到】 : 最近为文章补充数据开始做基因组DNA methylation分析,问一些白痴问题吧。 : 我们已经从别人文章里面retrieve了感兴趣的区域所有C的有methylation的sequencing : read count和total reads count,是否mC%就是等于 mC reads数目 / 总reads数吗 : ? : 我们想比较ChIP-Seq peak和没有蛋白binding地方的methylation有没有差异,如何计 : 算peak里面的methylation比例?还有看别人文章里面都能绘制一个分布曲线,一般用 : 什么软件可以做? : 有没有大牛可以推荐一下科普读物,最好可以速成。非常感谢。 : 节日快乐!
| h*********9 发帖数: 35 | 6 methylKit 用了 logistic regression, 不是很好的办法。
【在 a******r 的大作中提到】 : 纯算methyl 的话,我觉得R 的methylKit 不错,Biseq也可以 : 我不太懂你要在ChIP的算methylation的意思 : 前几年有个几个组 ChIP做完之后的DNA 再bisulfite 测序,量很低但是做出来了 : 这个technique 叫 ChIP-BS-seq : 你要是两个样品一个做ChIP 另一个做 methylation 会有 bias
|
|