由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Biology版 - 数字化、智能化、联网:寻找碳基生命的硅基未来zz
相关主题
关于生物信息的疑问呼唤actin大拿sunnyday
个性化医疗 vs. 癌症生物使用数学
我最恨的一种做presentation的方式谈谈和蛋白打交道的日子 (一)DNA测序, Sanger Style
第三代测序技术简介科学家的级别
discuss what are most popular research fields currently or in the near future请教一个统计学问题,需要多少个SNPs去鉴定一个人
问个error-prone PCR kit的问题各位觉得nanostring好用吗
请教:如何sequence biotinylated ss DNA oligo?help
也说下俺前老板AP曾经让俺干的活,让大家耻笑一下老闫近况,很拼命啊 (转载)
相关话题的讨论汇总
话题: 数字化话题: 生命话题: 基因话题: 学习话题: 计算机
进入Biology版参与讨论
1 (共1页)
j*********g
发帖数: 463
1
数字化、智能化、联网:寻找碳基生命的硅基未来
2017-06-07
“一旦计算机可以学习,整个世界都不一样了。”在不久前的“慈善+”2017跨界公益
论坛上,致力于把管理健康的权利还给每一个人的碳云智能创始人兼CEO王俊,向在场
观众构筑了一条碳基生命通往健康未来的硅基之路。
他认为,生命本身其实是一个学习系统,数字化、智能化、联网,将是未来碳基生命最
重要的发展方向,碳云智能要做的,就是构建一个生命的学习系统,从个体学习起,最
终帮助每个人管理自己的数字生命。以下为王俊演讲实录:
一只七星瓢虫引发的思考
这件事情要从我在北大上本科时讲起。这是我在北大的本科毕业论文,那是92年的时候
,25年前,个人计算机刚刚发达,所有人都把计算机当成一个大型的计算器。在那个时
候,我们在思考一个问题,我们想能不能做一个机器,模拟生物学的一些行为?我当时
本科论文做的是关于机器瓢虫的,自然界里面,蚜虫在一片叶子上是集团分布的,瓢虫
吃蚜虫时先开始随机行走,碰到食物之后不断转圈,直到把食物吃完,又继续随机行走
,这是自然界捕食行为的模式。
能不能在不告诉计算机的情况下,让计算机自己学会这样去吃食物?当时我做的本科毕
业论文,构建了一个很简单的神经网络,我没有告诉他怎样去做,而是让他用算法、神
经网络的方法,不断自我学习、自我迭代,过了十几万代以后,机器瓢虫可以进化出跟
自然界里面完全一模一样的方式。
也就是说,那个机器数字化的瓢虫,学会了自然界里的瓢虫做的一件事:捕食。这件事
情对我的触动很大,因为我知道计算机不仅仅可以计算,还可以思考,可以学习,一旦
计算机可以学习,整个世界都不一样了。
生命是一套学习系统
我们再来思考一下生命本身,生命本身其实是一个学习系统,像当时我们给那个机器瓢
虫写了一个学习程序,这个学习程序学会了怎样去捕食一样。实际上,生命本身就是一
套学习系统,这个学习系统的程序就是DNA,代码就是ATCG,人的基因组成单位。
从有生命以来到现在,人的基因是由30亿个ATCG组成的,大千世界里面每一个活着的东
西都有DNA,每一个活着的东西都采取了不同的学习策略,这种不同的学习策略对应着
它对周围环境的适应性,从病毒、微生物、动物、植物到人都是这样。
我创办的第一个企业叫华大基因,华大基因做的第一件事情就是把各种各样的动物和植
物进行萃取解读,把生命程序的代码,把这套“学习程序”不断读出来。人的基因程序
被读过很多遍,迄今为止,可能已经有几万人的数据被解读了,也有人说是十几万,因
为读的深度不一样。而读完之后,我们发现,人跟人之间的差异只有千分之一,这些非
常小的差异造成人跟人之间很大的不同,即使是个体都是人,但在个体之间都对应着不
同的适应机制。
比如说图的右下角,五个字母,AGGAA,这五个字母来自一个西藏人,西藏人有很强的
高山适应能力,这组基因能够让西藏人更加适应高原,在这个基因周围的五个字母,代
表了一种单体型、一种只有西藏人才有的基因型,而它并不来源于现代人,而是来源于
丹尼索瓦人的基因,这种来源是人类第三次走出非洲的时候演变的。
现在我们看到的每一个个体身上的生命程序,都是自然界进化上亿年的结果、不断的程
序和环境之间互动的结果,所以我们身上,我的这30亿个字母,每一个字母都具备上亿
年的历史,是我们的祖先在和环境进行不断博弈时留下的印记。通过读生命程序,可以
得到很多的事情。
这是现在“读基因”这件事可以具体应用的三个场景,第一个应用是出生缺陷,如果我
生下来时,基因就有毛病,往下运行,运行不下去了,就是一个BUG。现在我们都知道
,已经可以做产前筛查,不需要等到孩子出生以后再做基因检测,可以在妈妈肚子里,
通过测孕妇的血,知道孩子的单基因遗传病情况,这叫出生缺陷。
第二个是了解传染源,比如说发烧或拉肚子,病毒感染、细菌感染,都可以直接用数字
化的方式很简单地读出来。
第三个是个性化用药,比如说几乎每一种药物所有的研发都是针对于不同的基因来的,
一个肿瘤的发生,是因为基因发生了突变,到底是哪一个基因发生了突变,这个基因有
没有相对应的药物?这样就搭起关系,所以我们可以看到,现在所谓肿瘤的个性化治疗
,是在基因的发展领域里面非常厉害的研究方向。
所以直接通过基因检测,通过对基因、生命、学习程序的解读可以得出以上直接的应用
。但是基因本身并不能代表所有的事情,我举一个简单的例子,中国30年前糖尿病发生
率只有0.67%,但现在是11%,糖尿病前期患病率还有14%,就是接近25%。中国现在成年
人里面,1/4的成年人,要么得了糖尿病,要么即将得糖尿病。
基因并不代表生命的终点
但仅仅在30年的时间里,在只有一代人的时间里,我们的基因不会发生这么大的改变,
是什么东西变了呢?饮食发生了变化,生活方式发生了变化,环境发生了变化,所有的
这些变化都导致我们现在看到的很多慢性疾病的比例上升,但是你的基因没有变。
双胞胎,尤其是同卵双生的双胞胎,他们的基因几乎是一样的,只有非常小的差异。但
你会看到,即使是基因完全一样的双胞胎,在成年之后都可以变得很不一样,一个很胖
,一个很瘦。为什么在同样基因的情况下,会形成完全不同的结果呢?
比如说雾霾,北京的雾霾,在同样基因的情况下,我跑到北京来生活,我的基因受到强
大的压力,在这个压力下,肺病、肺癌、冠心病的比例会有不同程度的上升。
如果所有的东西以一张图表来表示的话,纵轴是指每种病的得病率,横轴是你的生命周
期。基因代表什么呢?基因代表的是一个固定的风险概率,是一个起点。比如说我生下
来的时候,可能我的二型糖尿病的得病概率比另外一个人高20%,这是概率起点,生命
程序带来的东西,我对于不同的疾病会有不同的风险概率的起点,但是它并不代表终点。
在你的人生旅程当中,你每天做的所有的决策,都会让这个概率高或者低,我今天吃多
一点,吃胖一点,可能得糖尿病的概率高了一点;我今天又健康生活了一点,身体就又
好了一点;我今天倒时差了,工作压力又大了,身体可能又不好一点……所以你生命当
中的每一个选择,都让你针对不同疾病的患病概率有不同层次的升高或降低。
问题是,此时此刻我站在这儿,我知不知道我过去的那张曲线图是什么样的,我知不知
道此时此刻我的那个点在哪儿?我们所有人都知道,糖尿病不会一夜发生,不会昨天还
好好的,血糖值很正常,今天去医院检查,突然间空腹血糖值高了,变糖尿病了,好像
糖尿病在一晚上就发生了,这种情况是不可能发生的。它是一个漫长的发展过程,整个
曲线是能够画出来的。
如果是这样,你每天会面临很多选择,导致这种疾病风险高或低的选择。你能不能知道
,哪一种选择是正确的,哪一种选择是你希望的,哪一种选择能够让你的值变来变去?
这就是现在生命科学研究的核心,它的核心是了解你的身体。
用计算机持续模拟生命的特质
我本科毕业时用计算机做了一个机器瓢虫,这个机器瓢虫可以模拟生命中真正的瓢虫去
做捕食行为的进化过程,多少代之后,跟生命当中是一模一样的。如果是这样,我这个
以碳为运算程序的碳基生物,如果我用一个计算机来模拟,重新去构筑一个硅基生物的
我,我自己的输入和输出全部数字化,全部交给那个计算机的硅基生物,我能不能够做
一个计算机的王俊?这个人可以模拟我的行为。
如果是这样,我就可以生活在所谓的平行宇宙里面,我每天需要做很多不同的选择,但
我不知道哪一种选择对我是好或不好,我可以先不用着急做,而是让我的计算机模拟一
下。我今天早上想吃早餐,又不想让血糖高,于是我可以让计算机运行一下,就知道什
么样的食物最合适。我要生病了,不知道吃什么药合适,我可以让计算机做一下,就知
道什么样的治疗方案对我是最合适的。
要做这样的东西不是一个很简单的事,第一步,是对整个身体的完全数字化。像我刚才
讲的,基因只是起点,不是终点。你的基因通过不同的环境和条件会有不同的中间结果
和最终结果,你看到的血糖值是临床的最终检测结果,但是血糖值的产生可能是由很多
代谢物、化合物、蛋白质、RNA共同作用形成的,所有这些东西都应该被数字化。
我的生活方式应该被数字化,我的饮食应该被数字化,我的运动方式应该被数字化,我
生活周边所有能看到的我的生存环境,我的肠道微生物,所有的东西都应该被数字。
如果这些东西被数字化了,我们就会发现,在未来身边的网络体系里面,所有的东西都
应该是聪明的。我应该使用聪明的车,在车上把我所有的行为、我各种各样的记录都用
数字化过程体现出来,不仅仅是智能手环记录心率这么简单,不仅仅有可穿戴设备,还
应该有可植入设备来监测我身体的行为,可能还需要聪明的桌子,聪明的椅子,聪明的
马桶……
我一直讲聪明的马桶这件事,每天很多信息都浪费了,直接被水冲掉了,如果能够把这
些信息记录下来,你的尿液、你的粪便,都能够放到数字化体系里面去,把这些数字化
的东西,全部集合起来,就会变成一个数字化的人,而这个数字化的人,要做的事情就
可以很多。
举一个例子,以我自己为例,我给自己做过很多次基因检测,发现我有痛风携带基因,
虽然并没有发展成痛风的症状。于是我去看我的尿酸值,平时三四百是比较正常的,最
高的时候可以达到九百多,像这样的情况,再延续十年、二十年,尿酸在我体内结晶,
出现各种各样的问题,我的关节就会变形,形成痛风,出现症状。怎么办呢?
数字化的我,它搜索了各种各样的中医宝典,各种各样的解决方案,跟我说你可以尝试
很多东西,我也尝试了很多东西,其中有一样东西——牛蒡,我去喝牛蒡茶,喝了三个
月之后,尿酸值回去了,回到了很正常的水平,这个东西不一定是对所有人都有用,但
是对我是有用的。为什么对我有用?我现在就要搞明白,我把所有的东西都要数字化。
每个人的基因不一样,每个人的数字生命不一样,每个人都有不同的个性化解决方案。
我们吃同样的一根香蕉,我吃完以后身体的血糖变化,和你吃完以后身体的血糖变化不
一样,到底什么样的东西对我是合适的?我们要构建的是一个学习系统,学习系统本身
做的最重要的事情,是学习你、学习我,所以我把这样的计划叫“数字化我”。
这个计划需要做很多实验,看我的碳基生命怎么反应,再看硅基生命能不能模拟。比如
说我可以问自己很多问题:我今天熬夜了,一晚上没睡觉,身体会怎么反应?我昨天喝
多了,喝了一瓶茅台,身体怎么反应?我跑了一场马拉松,身体怎么反应?我去登山了
,身体怎么反应?我有一个为期两周的严格饮食训练计划,从糖类到蛋白质等各种各样
的元素摄取进来后,身体怎么反应?
如果所有实验都在我自己身上发生,我自己身上发生以后的结果,都是对于“数字化我
”的训练的数据集,可以想像,不用多长的时间,他的行为,他形成的结果,跟我身体
真正的行为和结果会越来越一样,这就是我们现在做的目的。
构建数字化的生命学习系统
我们在构建一个学习系统,从个体学习起,逐步到群体。前一阵,我做了一件自己认为
挺疯狂的事情,去辟谷,七天不吃饭,我想知道在极端条件下,身体会怎么反应。提前
两周,我们做抽血,做各种各样的数字化准备。这七天,除了每天要走10公里路之外,
还要抽血、检测尿液、粪便。不仅仅我一个人,当时我们有七个合伙人一起做。
做完之后就发现数据的变化很有意思,比如说免疫系统的变化,身体里蛋白质的变化,
血糖值的变化,我们这几天的血糖值一直保持在很低的水平。其中有一个人一直在笑,
为什么呢?因为他撒谎了,有一天晚上他偷偷喝了杯咖啡,喝完咖啡以后,数据非常清
晰地展示出他喝咖啡的状况。
你可以看到,移动的图是免疫系统的变化状况,每个人的起点免疫系统是各不相同的,
但是七天不吃饭,在极端情况下,所有身体的免疫系统都在向同一个方向运动。我们现
在也在观察,这样的运动未来会有什么更有意思的应用场景。所以,每个人都可以对自
己做各种各样的尝试,更重要的是,“数字化我”计划,人工智能的学习系统或体系,
可以让你更好地了解你自己。你把自己碳基生命的语言翻译成计算机语言、计算机数据
,你不断给自己做实验,计算机系统在不断学习你做实验的结果,如果这样的反馈和运
行机制不断进行,这个人就会越来越了解你,越来越像你。
如果在几个月至半年的时间里严格控制饮食,血糖变化曲线就可以非常清楚地展现,吃
什么血糖高,吃什么血糖低,就可以做非常个性化的血糖管理方案,就不会担心糖尿病
的问题了。如果我需要做一个肿瘤方案,这么多治疗方案,哪一种是适合我的?如果有
一个“数据化我”,就可以做了。过去的时间只有一次,唯一线性发生的事情就是时间。
但有了人工智能的数字体系,就可以让你生活在平行体系里,不需要你自己着急去做决
定,可以让计算机先去做决定,他可以给到你无数种可能性,你可以在其中遴选一个你
认为最好的。诸如此类的应用很多了,不仅仅在营养、健康医疗方面,比如女孩子往脸
上擦的美容护肤产品,也是一个很重要的应用场景,我们现在是随便往脸上抹,所有的
厂家,无论是药厂、营养品公司、化妆品公司,还是护肤品公司,只想开发一种产品,
所有人都用,因为这样可以实现利益最大化。但事实上,每个人的情况不一样,每个人
都希望厂家开发出最适合自己的产品。
用大数据和人工智能定制你的“长寿药丸”
个体的解决方案要基于一个人对自身的了解之上,于是我们开始了一个计划,我们把所
有能够让人更健康、更长寿、更美丽的方法都尝试了一遍,我们做了一个大的计划,对
自己提出很多问题:如果我想活到120岁,想每天吃一颗长寿药丸,那么药丸里面应该
有什么?
比如低剂量的二甲双胍据说可以让我长寿;阿司匹林可以让我长寿;还有端粒酶的长度
可以让我长寿,所有的东西都可以试,但我很肯定,这些东西一定不会对每个人都有效
。我们首先应该描述自己此时此刻的身体年龄,比如我41岁,但我的身体是不是41岁我
并不知道,身体年龄是可以被精准描述的,可以通过很多标志物阐述出来。于是,我可
以开始做干预,吃长寿药丸、运动,做完干预之后再来看我的身体现在多少岁。经过不
同的迭代我会发现最适合我的长寿药丸是什么。所有的一切都基于我刚才讲的大数据、
人工智能的方法。
但有一些东西,我是永远不可能试的,我跟他们开玩笑,粪便移植。1600年前,中国老
祖宗就讲了,喝黄汤,把健康人群的肠道微生物取出,粪便移植到一个亚健康、慢性病
人身上,这个人整个健康状况就会有很大程度的好转。现在在这方面已经有各种各样的
尝试,比如说美国和香港都开始有所谓的粪便银行,储存健康粪便,实际上是储存里面
的菌群。
这个我还不是很能接受,也没有尝试过。但我在想另外一种方式,有没有可能把肠道微
生物全部分离和培养,再基于我自身的肠道微生物状况,选择性摄入我需要的肠道微生
物?如果可以做成这样,我就可以给每一个人做一个,不叫粪便药丸,而是叫肠道微生
物药丸,这样就可以让你活得更好一点,更健康一点,像这样的事情,我们也在做。
数字生命联网 帮助更多的人
当你对自身很多数字化信息有了非常精准的了解之后,下面最应该做的一件事,就是数
字生命的联网。今天的碳云已经数字化了,我们现在在做深度数字化的队伍已经有小一
千人了,每天来训练自己的AI,我可能是全世界数字化最多的一个人,我会不断训练我
的那个数字化的王俊,我没事就检验一下这个,检验一下那个,所有能数字化的东西,
我都会去数字化,此时此刻我胸口这儿还贴着心率贴,24小时监视着我的心电图。像我
这样的人有多少呢?一千人。
但你要知道,如果这一千人变成一百万人,我们能解决什么问题?目前我们所知道的世
界上排名前50名的疾病,所有的成因、诱因绝大多数就都被解决。你会清楚你为什么得
这个病,得了病之后怎么办,能不能预防和控制这个病。如果你把这些病和这一百万人
了解了之后,那么智商和基因的关系、身高和基因的关系,以及绝大多数跟基因之间的
风险关联都会被研究出来。
举一个简单的例子,一般罕见病的发病概率在万分之一,他们体内有一个基因产生基因
突变,就像我刚才讲的,程序发生了BUG,所以他们有一个单基因的疾病。但是有十万
分之一的人,这群人体内虽然发生了基因突变,却不发病。为什么不发病?因为可能有
其他保护性机制保护他不发病,生物学就是这样,总是有例外。
如果你能够把这样的数据链起来,就会发现每个人是可以互相帮助的,我的身体里可能
蕴藏着一些东西能帮助到你,毕竟没有一个人在这个世界上是完美的,每个人身体里总
是有各种各样的缺陷。而且我们现在看到,没有一个人是没有病的,只不过自己不知道
而已。而所有的这些,同样又有另外一个非常重要的假设,就是每一个人都是特别的。
当你把我刚才讲的数字生命本身联网,你会挖掘出每个人最特别的地方,我们需要做的
是,将它拿来帮助那个最需要的、不完美的人,这可能是未来最重要的应用方向。因为
很多疾病的发生都是个体化、个性化的,而这些个体化、个性化的人,一定可以从另外
一个个体,另一群人里面找到解决方案,这种解决方案只有把它们联网才有可能被发现
。所以在这个过程当中,三步曲是没有办法绕开的。
第一,把自己数字化,从头到尾的数字化,从基因到蛋白、代谢、肠道微生物、生活方
式,饮食……所有一切都要数字化。
第二,人工智能化,一堆数字放在那儿没有用,需要做一个数字化的你,不断训练他,
让他越来越像你,你可以利用他来帮助你做决策。
第三,联网,因为一个人的生命程序不可能解决所有问题,只有所有人合起来互相帮助
,才能解决更多的问题。在医学上,我们经常会看到很多同样的病例,在数字生命里也
会突然看到同样的数字生命,我们可以通过观察他是怎么做的,他在做什么选择,他选
择以后出现了什么结果,从而帮助到自己。
数字化、智能化、联网,将来会是数字生命最重要的方向,这就是碳云智能要做的事。
碳,生命是以碳为基础的,完全可以被数字化;云代表可以被联网;智能,意为生命可
以被计算,被人工智能化,这就是两年前我创办碳云智能的初衷。我希望构建一个生命
的学习系统,首先从个体学习起,帮助我们管理数字生命,最后从群体学习起,达到大
家互相帮助,把我们现在所能看到的疾病和不美好的东西,用科学和技术的力量解决并
改善,这就是我们做这件事的初衷,谢谢!
关于碳云智能
碳云智能科技有限公司成立于2015年10月,围绕消费者的生命大数据、互联网和人工智
能创建数字生命的生态系统。公司主要创始团队由全球顶尖生物科技专家组成,在组学
技术、移动医疗、医疗服务、生物数据分析、人工智能和数据挖掘等领域有丰富的经验
。基于全球专业度最高、指数增长的数字生命网络,我们致力同世界领先的合作伙伴一
起,去解读、研究、引导和管理数字生命,提供个性化管理数字生命的产品和服务,创
建数字健康新生活。更多信息,请访问icarbonx.com。
j*********g
发帖数: 463
2
王俊的口才、忽悠能力、炒作概念的能力真是一流
1 (共1页)
进入Biology版参与讨论
相关主题
老闫近况,很拼命啊 (转载)discuss what are most popular research fields currently or in the near future
求国内工作offer建议问个error-prone PCR kit的问题
聊聊personalized medicine。。请教:如何sequence biotinylated ss DNA oligo?
免疫疗法和个性化医疗是不是互相矛盾的?也说下俺前老板AP曾经让俺干的活,让大家耻笑一下
关于生物信息的疑问呼唤actin大拿sunnyday
个性化医疗 vs. 癌症生物使用数学
我最恨的一种做presentation的方式谈谈和蛋白打交道的日子 (一)DNA测序, Sanger Style
第三代测序技术简介科学家的级别
相关话题的讨论汇总
话题: 数字化话题: 生命话题: 基因话题: 学习话题: 计算机