H********g 发帖数: 43926 | 1 【 以下文字转载自 Military 讨论区 】
发信人: walkingtree (低烈度折腾), 信区: Military
标 题: 门外汉科普蛋白结构,望大牛斧正
发信站: BBS 未名空间站 (Sun Aug 23 00:01:38 2015, 美东)
俺老实交代,就是看看科普的知识水平,加点自己的思辨。
这个结构决定功能类似经济基础决定上层建筑,一定要这么说也大差不差。虽然dna序
列决定蛋白结构也算是大实话,但即使dna序列全解我们还是不能准确构建蛋白,特别
是功能基团(domain or motif?)。从这个角度看,能直接测量蛋白结构,然后和dna序
列对比,理论上我们可以得到生物的汇编语言。这就可以玩上帝了。
可惜,即使我们知道了全部dna和相当多的蛋白晶体结构,我们还是个屁。
你注意到了么,上句在蛋白结构之间插了个晶体。这就是关键所在了。EM是啥?电子显
微镜呐,拿电子轰击样品,根据反射折射逆向计算样品结构。这不就gamma探伤嘛。我
看难点有两个,一是结构复杂了,逆向计算上就有难度,还有精度问题(测不准原理适
用不?)一个是生物样品的制备,得挨上电子炮的饱和轰炸呐。
一公的工作在原创设计和计算上肯定是没啥贡献的,基本就集中在样品制备上了。这个
如果考虑授奖,可以占多大比例就很难讲了。特别是在技术和先例已经获奖的前提下,
很值得question一下。你有牛逼技术,拿奖没问题。你拿新(改进)技术解决一个问题
,可能也没问题。但你拿成熟技术解决一个类似问题,就很难说多大的突破了。
最要命的还不在这儿。要命的是晶体结构没啥用!
为了经得住电子炮,生物样品得做成晶体才够坚强,就是类似味精那样的晶体。可是,
可是,蛋白从来(还是绝大多数?)都不是按晶体结构工作的啊。要么是水溶液,要么
是油脂,要么混合。打嗝比方,胖大海,干的泡的很不一样,好不好。干的和湿的结构
之间还要建立映射关系才好用,对吧。可是如果可以测量似的结构,干的就没啥用了,
对吗?
所以我以为,蛋白晶体结构就是然并卵级别的发现。 |
H********g 发帖数: 43926 | 2 转过来目的不是嘲笑,只是看到错误的信息到处流传,实在忍不住正一下视听:
1) 晶体结构是非常可靠的。虽然理论上的确不是溶液构像,但是跟NMR结构比较的结
果是:实际上差不了多少。对一个学过有机化学的人来说,只要告诉他那些原子模型不
是拿铸铁整体浇筑的,应该就够了。解决晶体结构-溶液结构之间的区别,要靠计算机
模拟,就是前几年得诺奖的。不过这方面还需要大发展才能达到我们想要的水平。
目前理解蛋白质在水溶液里的行为的主要障碍就是在计算模拟方面。在微观世界里真正
的规律是量子规律,在简单系统里还可以模拟模拟,系统稍微复杂一点,就变得极其复
杂。所以虽然PDB里有几十万个蛋白质结构,人们在预测蛋白质行为方面的能力还是很
有限,还远没有达到看到一个蛋白质就可以推测出它的行为的能力。
科学的价值不是集邮,而是通过归纳规律,取得一定的预测能力。这方面结构生物学路
还很长。
2) 晶体结构一般是X-ray轰,X-ray和物质的相互作用没有电子那么厉害,所以辐射损
伤不像电子显微镜那么厉害(当然晶体里分子也多,承受能力高些)。在单分子冰冻电
镜里电子轰击的损伤是个主要制约因素,所以要控制每个分子受到的轰击的剂量,结果
是图片信噪比非常差,有些人发得电镜结构paper甚至被质疑你们看到的到底是什么东
西。晶体X射线衍射数据的信噪比则非常好,以现在的水平,一般很难搞错。
3) 冰冻电镜至少在目前,最大的好处是不用结晶,而很多非常大的东西都非常难结晶
。所以几年前新检测器出来以后,电镜结构分辨率提高到10A以内,就出现目前这个新
结构爆发的情况。在实用上,这个不用结晶造成的好处就是快。所以说十一公练武术,
谁也挡不住。有好机器,有充足的经费,知道什么东西可以做,这大概就是成功三要素。
4) 目前最有实用价值的结构就是晶体结构,用于设计药。因为晶体结构是可以达到原
子分辨率(1-2A)的,可以精确地看到小分子药物结合的地方或者可能结合的地方。在
药厂,一个普遍使用的方法就是拿蛋白质和药物共结晶,然后解晶体结构,来进一步了
解药物和蛋白质的结合情况。目前电镜结构可以自称达到3-4A,不过即便这种分辨率,
也只能看到蛋白质的二级结构这个层次,对制药来说没啥用。当然也许技术屏障会被继
续突破,有一天可以直接用显微镜看到结合在蛋白质上的小分子。
5) 十一公在方法学上没有任何贡献,包括做蛋白的各种技巧。晶体学发展的早期,也
有出一个结构就一篇CNS的情况,不过那个时候解解构是个技术活,很多著名的晶体学
家都受过很好的数理训练,跟现在不可以比。
(补充:如果用胖大海比喻的话,蛋白质晶体实际是泡发好的胖大海一排排码在一起。
实际上蛋白质晶体里还是比较湿的,而且蛋白质分子有软有硬,同一个晶体里的不同分
子之间有一样的地方有不一样的的地方,用胖大海比喻还挺合适。) |
S*E 发帖数: 3662 | 3 施一公如果搞清楚了生命蛋白的工作原理,那就是超诺奖水平的成果了。 |
w*x 发帖数: 3456 | 4 我其实一直有个问题,结晶出来的蛋白质结构能和有活性的时候一样吗?
【在 H********g 的大作中提到】 : 转过来目的不是嘲笑,只是看到错误的信息到处流传,实在忍不住正一下视听: : 1) 晶体结构是非常可靠的。虽然理论上的确不是溶液构像,但是跟NMR结构比较的结 : 果是:实际上差不了多少。对一个学过有机化学的人来说,只要告诉他那些原子模型不 : 是拿铸铁整体浇筑的,应该就够了。解决晶体结构-溶液结构之间的区别,要靠计算机 : 模拟,就是前几年得诺奖的。不过这方面还需要大发展才能达到我们想要的水平。 : 目前理解蛋白质在水溶液里的行为的主要障碍就是在计算模拟方面。在微观世界里真正 : 的规律是量子规律,在简单系统里还可以模拟模拟,系统稍微复杂一点,就变得极其复 : 杂。所以虽然PDB里有几十万个蛋白质结构,人们在预测蛋白质行为方面的能力还是很 : 有限,还远没有达到看到一个蛋白质就可以推测出它的行为的能力。 : 科学的价值不是集邮,而是通过归纳规律,取得一定的预测能力。这方面结构生物学路
|
v**********m 发帖数: 5516 | 5 生化数据验证是必须的。
【在 w*x 的大作中提到】 : 我其实一直有个问题,结晶出来的蛋白质结构能和有活性的时候一样吗?
|
H********g 发帖数: 43926 | 6 极少数情况不一样,绝大多数一样。为什么我们知道?因为我们还有化学知识,如果结
构化学上合理,没有理由认为它在体内会很不一样。
【在 w*x 的大作中提到】 : 我其实一直有个问题,结晶出来的蛋白质结构能和有活性的时候一样吗?
|
v**********m 发帖数: 5516 | 7 解释的非常到位。你真有空,佩服。
【在 H********g 的大作中提到】 : 转过来目的不是嘲笑,只是看到错误的信息到处流传,实在忍不住正一下视听: : 1) 晶体结构是非常可靠的。虽然理论上的确不是溶液构像,但是跟NMR结构比较的结 : 果是:实际上差不了多少。对一个学过有机化学的人来说,只要告诉他那些原子模型不 : 是拿铸铁整体浇筑的,应该就够了。解决晶体结构-溶液结构之间的区别,要靠计算机 : 模拟,就是前几年得诺奖的。不过这方面还需要大发展才能达到我们想要的水平。 : 目前理解蛋白质在水溶液里的行为的主要障碍就是在计算模拟方面。在微观世界里真正 : 的规律是量子规律,在简单系统里还可以模拟模拟,系统稍微复杂一点,就变得极其复 : 杂。所以虽然PDB里有几十万个蛋白质结构,人们在预测蛋白质行为方面的能力还是很 : 有限,还远没有达到看到一个蛋白质就可以推测出它的行为的能力。 : 科学的价值不是集邮,而是通过归纳规律,取得一定的预测能力。这方面结构生物学路
|
v**********m 发帖数: 5516 | 8 具体到某个不热门的蛋白,搞清这个属于然并卵,回国做副教授都够呛。
【在 S*E 的大作中提到】 : 施一公如果搞清楚了生命蛋白的工作原理,那就是超诺奖水平的成果了。
|
H********g 发帖数: 43926 | 9 主要的区别在于一些柔性强的部分,那些地方经常是在晶体结构里经常看不到的,这是
晶体结构的局限。
不过同一个分子可以有很多不同的结晶方式,一个晶体里看不清的也许在其它晶体形式
里看得到。
【在 w*x 的大作中提到】 : 我其实一直有个问题,结晶出来的蛋白质结构能和有活性的时候一样吗?
|
v**********m 发帖数: 5516 | 10 看来你没少往芝加哥那个鸟不拉屎的地方跑,还肯定踩过那里品味独特的三轮车。你们
被安排在哪个ID坑?
【在 H********g 的大作中提到】 : 主要的区别在于一些柔性强的部分,那些地方经常是在晶体结构里经常看不到的,这是 : 晶体结构的局限。 : 不过同一个分子可以有很多不同的结晶方式,一个晶体里看不清的也许在其它晶体形式 : 里看得到。
|
|
|
H********g 发帖数: 43926 | 11 家鸽不拉屎处我还真没去过。只去市中心泻拉吞大酒店开过会,哈哈。
【在 v**********m 的大作中提到】 : 看来你没少往芝加哥那个鸟不拉屎的地方跑,还肯定踩过那里品味独特的三轮车。你们 : 被安排在哪个ID坑?
|
H********g 发帖数: 43926 | 12 一个学科发展到完全靠分子热不热门来决定从业者的命运,也是够悲惨的。
【在 v**********m 的大作中提到】 : 具体到某个不热门的蛋白,搞清这个属于然并卵,回国做副教授都够呛。
|
d****o 发帖数: 32610 | 13 原来全能神是做结构的
【在 H********g 的大作中提到】 : 转过来目的不是嘲笑,只是看到错误的信息到处流传,实在忍不住正一下视听: : 1) 晶体结构是非常可靠的。虽然理论上的确不是溶液构像,但是跟NMR结构比较的结 : 果是:实际上差不了多少。对一个学过有机化学的人来说,只要告诉他那些原子模型不 : 是拿铸铁整体浇筑的,应该就够了。解决晶体结构-溶液结构之间的区别,要靠计算机 : 模拟,就是前几年得诺奖的。不过这方面还需要大发展才能达到我们想要的水平。 : 目前理解蛋白质在水溶液里的行为的主要障碍就是在计算模拟方面。在微观世界里真正 : 的规律是量子规律,在简单系统里还可以模拟模拟,系统稍微复杂一点,就变得极其复 : 杂。所以虽然PDB里有几十万个蛋白质结构,人们在预测蛋白质行为方面的能力还是很 : 有限,还远没有达到看到一个蛋白质就可以推测出它的行为的能力。 : 科学的价值不是集邮,而是通过归纳规律,取得一定的预测能力。这方面结构生物学路
|
H********g 发帖数: 43926 | 14 不可以臆测神
【在 d****o 的大作中提到】 : 原来全能神是做结构的
|
w*********a 发帖数: 9279 | 15 难怪
蝗虫每天的工作就是看蛋白质和上学术版发帖
【在 d****o 的大作中提到】 : 原来全能神是做结构的
|
d****o 发帖数: 32610 | 16 敢说十一公在方法学上没有任何贡献,肯定是对这个领悟很熟悉了
【在 H********g 的大作中提到】 : 不可以臆测神
|
H********g 发帖数: 43926 | 17 读两年硕士就足够说这句话了
【在 d****o 的大作中提到】 : 敢说十一公在方法学上没有任何贡献,肯定是对这个领悟很熟悉了
|
d****o 发帖数: 32610 | 18 做结构生物学好像是得数理化生信都有谱
跟全能神水平很符合
【在 w*********a 的大作中提到】 : 难怪 : 蝗虫每天的工作就是看蛋白质和上学术版发帖
|
d****o 发帖数: 32610 | 19 那也是做过
【在 H********g 的大作中提到】 : 读两年硕士就足够说这句话了
|
v**********m 发帖数: 5516 | 20 那是一定的,nature的第一作者,即使他只会做蛋白表达也比普通文章一位能从基因做
到化学计算的更容易做教授。烂坑就是这么炼成的。
【在 H********g 的大作中提到】 : 一个学科发展到完全靠分子热不热门来决定从业者的命运,也是够悲惨的。
|
|
|
H********g 发帖数: 43926 | 21 然后恶性循环,行业整体水平越来越低
【在 v**********m 的大作中提到】 : 那是一定的,nature的第一作者,即使他只会做蛋白表达也比普通文章一位能从基因做 : 到化学计算的更容易做教授。烂坑就是这么炼成的。
|
v**********m 发帖数: 5516 | 22 不懂化学计算,不懂空间群,不知道傅立叶变化,不知道发展新方法的的XRD结构生物
学教授一堆一堆。训练出来的博士做蛋白表达纯化又快又好。
以后行业就拼钱,机器和体力了。
【在 H********g 的大作中提到】 : 然后恶性循环,行业整体水平越来越低
|
H********g 发帖数: 43926 | 23 然后被em族灭。
其实很多博士做蛋白春花都不能做到又快又好,只不过就是拼五六年终于幸运了一两次
。化学不要说计算,连基本实验室化学都不通。
【在 v**********m 的大作中提到】 : 不懂化学计算,不懂空间群,不知道傅立叶变化,不知道发展新方法的的XRD结构生物 : 学教授一堆一堆。训练出来的博士做蛋白表达纯化又快又好。 : 以后行业就拼钱,机器和体力了。
|
v**********m 发帖数: 5516 | 24 说实话,我觉得王状元的结构生物学基础不错,只是他不适应结构生物学的这种拼机器
拼体力的新玩法,学术生涯被玩死了。
一个特别牛逼的结构生物学藤校老教授说过,结构生物学已经到了拼钱和体力的阶段,
他的组对11公表示甘拜下风,举手投降。
【在 H********g 的大作中提到】 : 然后被em族灭。 : 其实很多博士做蛋白春花都不能做到又快又好,只不过就是拼五六年终于幸运了一两次 : 。化学不要说计算,连基本实验室化学都不通。
|
H********g 发帖数: 43926 | 25 博士供应过剩了
【在 v**********m 的大作中提到】 : 说实话,我觉得王状元的结构生物学基础不错,只是他不适应结构生物学的这种拼机器 : 拼体力的新玩法,学术生涯被玩死了。 : 一个特别牛逼的结构生物学藤校老教授说过,结构生物学已经到了拼钱和体力的阶段, : 他的组对11公表示甘拜下风,举手投降。
|
w*x 发帖数: 3456 | 26 我印象xray做NaCl之类的晶体好像最后的结构和理论值的差别在5%以内好像蛋白质经常
都是20%。我觉得这个东西太art了。。。
【在 H********g 的大作中提到】 : 主要的区别在于一些柔性强的部分,那些地方经常是在晶体结构里经常看不到的,这是 : 晶体结构的局限。 : 不过同一个分子可以有很多不同的结晶方式,一个晶体里看不清的也许在其它晶体形式 : 里看得到。
|
H********g 发帖数: 43926 | 27 那是用最后的结构模型算出来的理论衍射数据跟实际测量的衍射数据比,大概会有20%
的误差。这么大的误差主要两个方面:1) 蛋白质衍射的信号比小分子衍射弱很多,所
以测量过程里系统误差本身就很大(实际上蛋白质衍射数据自己跟自己就可以差5-10%
左右,这还是正常的范围) 2)蛋白质晶体本身比盐晶体复杂很多,它里面很多细节是
很难模拟的,尤其是去从衍射数据倒推的话(衍射光波的强度可以测,但是相差信息丢
失了,只能用不直接的办法猜测,这里面总有误差和错误,【猜相这方面的确可以说是
很art,是错误的主要来源】)。
从实用角度说,这20%的误差主要影响的是:蛋白质分子上的一些精细结构,晶体本身
的一些非理想性质,晶体里液相部分的一些性质(蛋白质晶体里一般30-70%的体积是液
体,就像把球摞在一起,球之间会有很多空隙一样),对蛋白质结构的可靠性并没有多
大影响。
理论上假如一个蛋白质的理论模型完全是跟数据不相干的,算出来的误差应该是百分之
六十三。如果硬把一个错的结构往数据上凑,百分之二十几三十几的误差倒是也能凑出
来。不过有很多手段和迹象可以用来检测这种情况。实际世界里,2A以上的高分辨率的
晶体结构基本上不存在出这种大错的可能,因为这种结构会有几万到几十万个数据点,
细节太丰富,足够互相印证了。8-3A的结构出错的可能还是有的。
参考资料(不一定好懂,哈哈):
https://en.wikipedia.org/wiki/R-factor_(crystallography)
http://www.rcsb.org/pdb/101/static101.do?p=education_discussion
【在 w*x 的大作中提到】 : 我印象xray做NaCl之类的晶体好像最后的结构和理论值的差别在5%以内好像蛋白质经常 : 都是20%。我觉得这个东西太art了。。。
|
H********g 发帖数: 43926 | 28 蛋白质晶体结构里,蛋白质本身的大体结构往往是非常靠谱的。
不靠谱的部分大部分都在细节里,比如一个氨基酸侧链到底在这里还是那里,一个化学
修饰到底是真的存在还是作者的wishful thinking,一个小分子ligand(离子,药物,
糖,脂肪之类的)到底真的是不是存在在结构里(这个方面问题最大,有人估计PDB里
大概50%以上的ligand结构不存在或者构像给搞错了)。这些细节东西非得比较有经验
的人才能看出来,所以不搞这个的人,一个选择是人家咋说你就咋信(A),一个选择
是啥也不信(B)。我个人的建议是对于分辨率在5-2.5A之间的结构,选B,对于1.0-2.
0A之间的结构选A为主。
【在 w*x 的大作中提到】 : 我印象xray做NaCl之类的晶体好像最后的结构和理论值的差别在5%以内好像蛋白质经常 : 都是20%。我觉得这个东西太art了。。。
|
m**********a 发帖数: 10817 | 29 现在不都是remote了吗
【在 v**********m 的大作中提到】 : 看来你没少往芝加哥那个鸟不拉屎的地方跑,还肯定踩过那里品味独特的三轮车。你们 : 被安排在哪个ID坑?
|
m**********a 发帖数: 10817 | 30 小分子和大分子的区别
【在 w*x 的大作中提到】 : 我印象xray做NaCl之类的晶体好像最后的结构和理论值的差别在5%以内好像蛋白质经常 : 都是20%。我觉得这个东西太art了。。。
|