m***o 发帖数: 272 | 1 在做5-race,目的是得到一个蛋白的short form。已经得到了一个从exon6开始转录的
短的RNA,而且也得到一些UTR序列在5intorn。 用的是ambion First choice RLM RACE
KIT. 得到的片段测序,mRNA起始的位点总是不一样。起始点最长有60bp的差别。而且
在UTR序列里面有3个ATG都在读码框架里,请问怎么知道哪个ATG是真正的翻译起始点?
除了RACE,还有什么实验可以确定mRNA的起始点呢?
另外一个问题,在做另一个蛋白的RACE时候,得到过两次先表达Exon5,然后是exon2的
序列,有这样的exon rearrangement 吗?就是先转录下游的exon然后再回过头转录上
游的exon? 第一次得到这个结果的时候觉得可能是artificial,但是用不同的primer又
得到了一次这样的结果。而且还是complete的exon序列。请各位发表点意见建议吧,我
google也没有找到类似的事情。 |
w*****n 发帖数: 107 | 2 1. a) It is not surprising that a gene has multiple transcription start
sites.
b) You can use the Kozak sequence to PREDICT which ATG is likely to be
used as translational start site.
2). This looks odd.Are you sure the direction of the gene you look at is
correct? Because in the kit, there use random oligo to synthesize cDNA,
followed by gene-specific primer for PCR.
Good luck! |
C*******e 发帖数: 4348 | 3 除了5' RACE还可以做primer extension啊
不过就是要用P32
如果同时又好几个mRNA TSS的话
结果上也会看到几个不同大小的片段
然后根据信号的强弱可以知道哪个是主要的TSS
对于翻译起始位点
不能光看ATG吧
还要结合RBS看 |
K**4 发帖数: 1015 | 4 For 5'RACE, choose the longest one. Short ones may be degenerated mRNA,
although the longest one is most likely degenerated too.
ATGATGATG is a way to start an effective translation.
RACE
【在 m***o 的大作中提到】 : 在做5-race,目的是得到一个蛋白的short form。已经得到了一个从exon6开始转录的 : 短的RNA,而且也得到一些UTR序列在5intorn。 用的是ambion First choice RLM RACE : KIT. 得到的片段测序,mRNA起始的位点总是不一样。起始点最长有60bp的差别。而且 : 在UTR序列里面有3个ATG都在读码框架里,请问怎么知道哪个ATG是真正的翻译起始点? : 除了RACE,还有什么实验可以确定mRNA的起始点呢? : 另外一个问题,在做另一个蛋白的RACE时候,得到过两次先表达Exon5,然后是exon2的 : 序列,有这样的exon rearrangement 吗?就是先转录下游的exon然后再回过头转录上 : 游的exon? 第一次得到这个结果的时候觉得可能是artificial,但是用不同的primer又 : 得到了一次这样的结果。而且还是complete的exon序列。请各位发表点意见建议吧,我 : google也没有找到类似的事情。
|
m***o 发帖数: 272 | 5 谢谢wenqian and chamgrape。
1.如果gene有很多不同的转录起始点,那这些都是capped的吗?如果miss掉了ATG那岂
不是造成能量的浪费了吗?
2.direction 可以确定是对的,不太明白怎么可以方向不对,因为kit里面是forward
primer, you have your gene specific primer as reverse primer.
pubmed里那么多的gene都是primer extension得到的全序列吗? |
m***o 发帖数: 272 | 6 谢谢Ka84.the first 2 ATG do is together like ATGATG, the third ATG is 3 AA
downstream. so I check the sequence, maybe the second is most strong one. |
Z******5 发帖数: 435 | 7 其实要找翻译起始位点为什么不从蛋白质入手呢?打个质谱就搞定了。
退一步,如果你有部分蛋白序列,也可以大概推测一下,看看读码框,说不定就能找到
起始的ATG。
如果要从纯序列入手,貌似记得以前分子生物学上讲过,一般ATG前面的序列会形成茎
环的二级结构,便于ATG的识别(我觉得这个不太靠谱)。当然也注意一下读码框,看
看哪个ATG翻译出来的序列比较合理。(比如可以看终止密码子的位置,就知道蛋白大
小是否合理, 检查翻译出的蛋白质的序列特征,比如预测一下可溶性等)
===========================
关于TSS的问题,现在一般认为很多基因都是有多个TSS的。比如我做的一个基因,就发
现在不同的细胞中使用不同的TSSs,大概查几十bp。 建议你挑20个以上克隆测序,然
后看TSS的分布情况。 当然为了省事,你测十来个,直接说最长的那个就是也可以(现
在很多文章也是这么发的),或者不做克隆,直接将最后一轮的PCR产物测序。 |
j****x 发帖数: 1704 | 8 估计你做的这个gene甚至物种是没有已知的基因组序列信息的吧,否则你也就不会费劲
做RACE了。
把你的编码产物比对一下近缘物种的基因组序列(如果有全长cDNA序列当然最好),蛋
白质的N端往往是比较保守的,根据近缘物种的ortholog可以很大程度上帮助你确定5'
端起始位点。
如果你确定你拿到了完整的5'端序列(包含UTR),那么根据Kozak规则,ORF里第一个
符合Kozak规则的ATG就很大可能是起始ATG。真核mRNA不同于原核mRNA,基本不存在什
么RBS序列的概念,5' mG cap就是核糖体识别和结合的位点,然后往下游移动遇到合适
的ATG就开始翻译了(至少我当年上医学分子生物学的时候老师是什么说的,呵呵)
如果你不确定你是否获得了完整的mRNA 5'序列,那么继续吧,至少先通过NB等方法确
定一下可能有几个转录本,最长的转录本有多大。因为alternative splicing等等因素
的存在,一个基因存在多个翻译起始位点确实很常见,这也是基因表达调控的一种重要
方式了,遇到这种情况,你可能需要在5' RACE的引物设计上下点心思,用来区别不同
的mRNA产物。 |
m***o 发帖数: 272 | 9 谢谢楼上各位。
tozifeng85: 蛋白纯化不出来是不可以打质谱吧,有3个离的很近的ATG都在读码框架里。
juzbox,我做的这个gene有全gene序列,而且已经知道全长cDNA的序列,就是根据全长
序列,我才能说这个短的有3个ATG都在读码框架里。知道基因组序列信息可以怎么做而
不用做RACE呢?有什么网站或者软件推荐吗?
另外蛋白N端比较保守,我觉得不对呢,我读了些alternative splicing 的文章,大部
分是N端不一样,而都保留相同的C端。
我现在比较确定拿到了比较靠5‘端的序列,但是不能保证就是最长的,而且再上游没
有ATG。 现在打算是先设计几个引物,在得到的最长的序列的5’和3‘端,做RTPCR,
然后看看产物强弱,再设计几个RACEprimer比较靠近5’端,再挑一轮clone测序。
另外先转录下游exon再转录上游exon的情况没有人遇到过吗? |
w*******d 发帖数: 396 | 10 Just my personal opinions for your reference. Maybe I am wrong.
1. If it is up to me, I will subclone the longest fragment and fuse it to
the upstream of a reporter gene, then mutate the three respective ATG to see
if there is any difference. Ususlly, the first ATG is dominant in
transcription.
2. Is it possible that your GSP acutally recognize a sequence in the reverse
orientation and there is a transcript generated in the reverse orientation?
There maybe duplicated sequence in genome. |
|
|
j****x 发帖数: 1704 | 11 一般而言真核生物翻译起始的规则是,符合Kozak规则的一个ATG就是起始ATG。查一下
你这3个离得很近的ATG哪些是符合“AXXATGG”条件的,简言之只要-3位点是A或者+4位
点是G,那么就足够起始翻译了。如果你的第一个ATG就符合,那应该就没什么疑虑了。
后面的2个ATG如果也符合,那么理论上也有可能起始翻译,但是效率会比第一个ATG低
很多很多倍。你可以设想,在正常蛋白序列中,N端有多个相距不远的M是很正常的事情
,要是随机从这些M开始起始翻译,还不乱套了。
你也说有了cDNA序列和gene序列了,那么理论上的最长翻译产物自然是清楚的了,用这
个氨基酸序列比对模式物种,如果N端能匹配,自然是很强的佐证了。
里。
【在 m***o 的大作中提到】 : 谢谢楼上各位。 : tozifeng85: 蛋白纯化不出来是不可以打质谱吧,有3个离的很近的ATG都在读码框架里。 : juzbox,我做的这个gene有全gene序列,而且已经知道全长cDNA的序列,就是根据全长 : 序列,我才能说这个短的有3个ATG都在读码框架里。知道基因组序列信息可以怎么做而 : 不用做RACE呢?有什么网站或者软件推荐吗? : 另外蛋白N端比较保守,我觉得不对呢,我读了些alternative splicing 的文章,大部 : 分是N端不一样,而都保留相同的C端。 : 我现在比较确定拿到了比较靠5‘端的序列,但是不能保证就是最长的,而且再上游没 : 有ATG。 现在打算是先设计几个引物,在得到的最长的序列的5’和3‘端,做RTPCR, : 然后看看产物强弱,再设计几个RACEprimer比较靠近5’端,再挑一轮clone测序。
|
m***o 发帖数: 272 | 12 Thanks, whitesand.
1. We are thinking of doing that way. But most plasmid has a strong promoter
, I am guessing whenever they meet ATG they all will transcribe. The other
possible is we clone this gene's own promoter and mutate each of the 3 ATG
to see. There will be a lot of work and now I do not have any idea how long
the promoter will be.
2. If my GSP recoginze a sequence in the reverse orientation, why it
transcript the complete exon not part of it?
I am thinking of what wenqian said because the kit use random primer,it is
possible the second structure of the mRNA is speicial and make the cDNA from
the exon 5 very near exon2 and by some unknown reason they connect together
. I am planning to design primer at exon5, 6, and 2 to do RTPCR and see what
I got.
To Juzbox,My 1st ATG do not have -3A and +4G, the 2nd one because is ATGATG
together so it has -3A but no +4G. the 3rd ATG which is 2 amino acid away
has -3A but no +4G. looks I should considering the 2nd ATG. |
c******r 发帖数: 3778 | 13 嘿嘿,还是你明白
这个问题其实是molecular biology比较经典的问题。过去有很多解决方法。但是现在
。。。其实很简单。后面的ATG几乎没有start的机会。除非,搞个牛的基因,full
genomic sequence不清楚,那还需要primer extension一下,否则绝大多数都不需要这
么麻烦。他的race一般过去也是拿到一段sequence,然后重新设计primer在5 prime再
次做race。一般大小的mRNA有个几次就是full sequence了。
如果lz的mRNA有60bp的差别,最简单就是用这60bp做个RT-PCR,或者设计个probe在这
60bp的头上,做个northern就知道哪里开始了。
【在 j****x 的大作中提到】 : 一般而言真核生物翻译起始的规则是,符合Kozak规则的一个ATG就是起始ATG。查一下 : 你这3个离得很近的ATG哪些是符合“AXXATGG”条件的,简言之只要-3位点是A或者+4位 : 点是G,那么就足够起始翻译了。如果你的第一个ATG就符合,那应该就没什么疑虑了。 : 后面的2个ATG如果也符合,那么理论上也有可能起始翻译,但是效率会比第一个ATG低 : 很多很多倍。你可以设想,在正常蛋白序列中,N端有多个相距不远的M是很正常的事情 : ,要是随机从这些M开始起始翻译,还不乱套了。 : 你也说有了cDNA序列和gene序列了,那么理论上的最长翻译产物自然是清楚的了,用这 : 个氨基酸序列比对模式物种,如果N端能匹配,自然是很强的佐证了。 : : 里。
|
j****x 发帖数: 1704 | 14 LZ现在的困惑不是转录起始位点,转录起始位点就是mRNA 5'UTR开始的位置,这个5'
RACE如果做的好的话直接就出来了,毕竟他genomic/cDNA序列基本是明确的,从前RACE
都是根据部分已知的序列来获取剩下的未知序列的,难度差多了。
LZ现在困惑的是翻译起始位点,这个和mRNA 5'端是否有60bp的差别关系不大,通过
northern也无法确定核糖体究竟从哪个ATG开始翻译。如果有ortholog就序列比对一下
看看其他物种中有没有已经鉴定过的同源蛋白,因为相对而言N端是保守的(不讨论
isoforms)。
就像你说的,基本上第一个ATG就是起始ATG,即使不是最佳的Kozak序列,至少也能低
水平的起始翻译,后面的ATG除非有IRES,否则很难有很强的表达,这甚至还有可能是
表达调控的一种方式。
【在 c******r 的大作中提到】 : 嘿嘿,还是你明白 : 这个问题其实是molecular biology比较经典的问题。过去有很多解决方法。但是现在 : 。。。其实很简单。后面的ATG几乎没有start的机会。除非,搞个牛的基因,full : genomic sequence不清楚,那还需要primer extension一下,否则绝大多数都不需要这 : 么麻烦。他的race一般过去也是拿到一段sequence,然后重新设计primer在5 prime再 : 次做race。一般大小的mRNA有个几次就是full sequence了。 : 如果lz的mRNA有60bp的差别,最简单就是用这60bp做个RT-PCR,或者设计个probe在这 : 60bp的头上,做个northern就知道哪里开始了。
|
m***o 发帖数: 272 | 15 我是不是还没有讲明白,急死了。转录和翻译的起始点我都困惑。
这个5UTR是在原来gene的intron里面。
关于翻译的起始点,是不是原则No1是第一个ATG一般就是起始的,No2 才是考虑Kozak
序列。虽然后面的两个有Kozak序列,但因为第一个ATG挡在那里,所以翻译还是从第一
个开始。
关于转录的起始点,我测了20多个序列了。如果第一个ATG的A为0,那么我只有一个在
大概-70(这是最远的),有2个在-4,其余的大概好几个就在+4+5+6位置,还有好多在
+15to+18之间(这个就是3个ATG的下游了)。(原来说的60个bp的差别该改成88个)。
如果在3个ATG的下游,那岂不就没法翻译了吗。不过PCR倾向于拷短的条带,所以有可
能放大了短的片段。
然后我用RT-PCR把5‘引物放在+24,可以看到很强的条带,放到-20条带就弱了很多,
放到-70位置,就更弱了。但是都能看到条带,而且对照很干净,所以就是说这些不同
长度的RNA都存在。而且还有可能-90的位置可能也转录了,但是我没有得到克隆测序。
所以我现在就很想知道转录到底哪是起始点。
另外做5-RACE,大家可以得到很一致的序列吗?kit的protocol也建议多测序,我想得
到不同的长度也很正常,但是我做另一组的RACE的时候就很怪,5个克隆全是一样的序
列,结果呢就是后面的exon跑到了前面去了。
所以我就困惑困惑------ |
p******i 发帖数: 1092 | 16 转录的起始位点:
如果有TATA BOX, 很可能是single transcription start site,
但是大多数真核gene都没有TATA BOX,所以都是有好几个TSS clusters,每个TSS
cluster里面的TSS们大概在200bp这么大的范围之内
如果有几个相聚较远的TSS cluster,那么这个gene有可能有不同的mRNA species,但
是还是要做实验去验证
是不是应该针对每一个mRNA species,再单独考虑start codon 的问题?
however... 貌似很多gene都有不同的mRNA species,但是不一定这些mRNA species都
有功能,更不一定都会translate成蛋白
你说你的目的是得到一个蛋白的short form,
你expect short form和wild type的区别是什么?
after all, if there is nothing new about this short form, you cannot publish
, right?
是不是可以把可能的short form的ORF都表达出来,然后和wild type做对比?
【在 m***o 的大作中提到】 : 我是不是还没有讲明白,急死了。转录和翻译的起始点我都困惑。 : 这个5UTR是在原来gene的intron里面。 : 关于翻译的起始点,是不是原则No1是第一个ATG一般就是起始的,No2 才是考虑Kozak : 序列。虽然后面的两个有Kozak序列,但因为第一个ATG挡在那里,所以翻译还是从第一 : 个开始。 : 关于转录的起始点,我测了20多个序列了。如果第一个ATG的A为0,那么我只有一个在 : 大概-70(这是最远的),有2个在-4,其余的大概好几个就在+4+5+6位置,还有好多在 : +15to+18之间(这个就是3个ATG的下游了)。(原来说的60个bp的差别该改成88个)。 : 如果在3个ATG的下游,那岂不就没法翻译了吗。不过PCR倾向于拷短的条带,所以有可 : 能放大了短的片段。
|
m***o 发帖数: 272 | 17 Philipli,十分感谢你的建议。
做short form 的目的是:wild type 和short form是在不同的组织中表达。以前认为
这个gene only expressed in one specific tissue A, but after the lab got the
knock out mice, it has different phenotype. We trying to figure out the
mechanism if these related with the specific tissue A or the gene also
expressed in other tissue but at short form.
我现在是打算把这个short form最长的ORF表达出来看看,但是老板感兴趣的那个组织
我没有检测到,所以还会继续race.
还有问题没有彻底明白:
1 现在这个short form的TSS,我测到的是大概90bp的差别,是不是可以说是一个TSS
cluster?
2 你说每个cluster里面有大概200bp的差别,记得看过一篇文章说短的5UTR,可能就意
味着很强的表达,那如果有200bp的差别,那细胞岂不是有很多mRNA就miss掉了ATG,那
岂不是一种浪费?
3 mRNA species 是不是就指不同的tss 而且会导致产生不同长度的蛋白,和
alternative splicing 是两个概念吗?
谢谢! |
c******r 发帖数: 3778 | 18 有证据证明这个short form存在吗?
the
【在 m***o 的大作中提到】 : Philipli,十分感谢你的建议。 : 做short form 的目的是:wild type 和short form是在不同的组织中表达。以前认为 : 这个gene only expressed in one specific tissue A, but after the lab got the : knock out mice, it has different phenotype. We trying to figure out the : mechanism if these related with the specific tissue A or the gene also : expressed in other tissue but at short form. : 我现在是打算把这个short form最长的ORF表达出来看看,但是老板感兴趣的那个组织 : 我没有检测到,所以还会继续race. : 还有问题没有彻底明白: : 1 现在这个short form的TSS,我测到的是大概90bp的差别,是不是可以说是一个TSS
|
m***o 发帖数: 272 | 19 western blot上在别的组织上有个短的条带在WT上有,但是在knockout上就消失,别的
非特异条带没有变化。但是我现在觉得这个我找到的shortform不是看到的那个条带,
因为根据这个序列推测蛋白要小很多。
现在我比较确定这个shortform mRNA 的表达在我做的这个组织上很高,因为RT用这个
短的5UTR为forward primer(全长没有这个序列),可以看到很亮的条带,但是别的组
织没有。
我现在也有些不知该怎么往下做,因为抗体不是很好,很多非特异条带。 |
m***o 发帖数: 272 | 20 刚补习了些基础知识,我想这种情况就是所谓的alternative promoter。进化就是用这
种方法来进行组织特异性表达,和调控。 |
p******i 发帖数: 1092 | 21 你现在有一个从intron5开始,接上exon6的RNA
就现有的序列,你不妨把可能的ORF(从每个ATG开始)都translate一遍:
一种可能是short form protein和wild type蛋白是相同reading frame,只是短了很多
。如果是这样的话,wild type蛋白的functional domain在short form protein里还有
多少?
另外一种可能就是short form protein有新的reading frame...
当然,还有可能就是你现在看到的ATG都不是start codon...
【在 m***o 的大作中提到】 : western blot上在别的组织上有个短的条带在WT上有,但是在knockout上就消失,别的 : 非特异条带没有变化。但是我现在觉得这个我找到的shortform不是看到的那个条带, : 因为根据这个序列推测蛋白要小很多。 : 现在我比较确定这个shortform mRNA 的表达在我做的这个组织上很高,因为RT用这个 : 短的5UTR为forward primer(全长没有这个序列),可以看到很亮的条带,但是别的组 : 织没有。 : 我现在也有些不知该怎么往下做,因为抗体不是很好,很多非特异条带。
|