曹操读书--知行合一,化于无形

AlphaFold2爆火背后,人类为什么要死磕蛋白质?

作者 :钛媒体 App 2021-07-31 08:53:12 审稿人 : admin 围观 : 评论

文 | 脑极体Otz曹操读书网

近期在生命科学领域,有一则爆炸性的新闻,DeepMind 的Al phaFold2模型,将人类的98.5%的蛋白质,全部预测了一遍,并且做成了数据集免费开源,供科研圈的人使用。Otz曹操读书网

开放的数据集不仅包括人类蛋白质组,还有大肠杆菌、果蝇、小鼠等20个具有科研常用生物的蛋白质组数据,总计超过35万个蛋白质的结构。AlphaFold2模型的目标是为所有具有已知序列的蛋白提供预测结构。Deepmind计划在年底将预测数量增加到1.3亿个,而这个数量已经达到了人类已知蛋白质总数的一半。Otz曹操读书网

Otz曹操读书网

科研圈因为这一新闻都炸锅了,平时需要花费数月、数年的才能完成的事情,只需要几天就可以搞定,大家无一不在赞叹这个具有划时代意义的时刻。DeepMind联合创始人兼CEO Demis Hassabis谈道:“我认为这是DeepMind整个10年多生命周期的顶峰。”对于研究人员来说,丰富的蛋白质结构数据有了,开展下一步的研究就顺畅了。Otz曹操读书网

内行人看门道,外行人看热闹,对于学术圈人的集体高潮,外行人的内心都有个大大的问号,预测这么多的蛋白质结构究竟有什么卵用?人类为何一直在和蛋白质死磕?Otz曹操读书网

研究蛋白质的意义

回答这个问题之前,不得不提及生命科学领域最重要的中心法则:遗传信息在细胞内的生物大分子间转录从DNA→RNA→蛋白质。Otz曹操读书网

如何理解呢?在生物世代繁衍的过程中,生物会把自身携带的遗传物质DNA分子,通过复制传递给后代,而在每一代生物从生到死的过程中,这套DNA分子以自身为设计蓝图,指导生产大量的蛋白质分子,执行支持生物生存和活动的全部功能。Otz曹操读书网

中心法则的一端是DNA,一端是蛋白质,DNA可以看做是工厂里面生产制造的设计图纸,而蛋白质就是有各种功能的零部件,造出来的蛋白质有的跑去参与体内各种生物化学反应,比如食物的消化有各种酶的参与,有的在血液中(血红蛋白)积极的运输养料,有的作为信使在细胞之间传递信号,有的作为卫士,参与生物体的免疫大战,各种设计组装出厂的不同蛋白质可以让遗传、发育、繁殖、代谢等生命活动正常运行开展。Otz曹操读书网

对蛋白质进行系统深入的研究,能让我们从更深层次诠释生命体的构成和运作变化规律,进而全面揭示生命运行、发展的机制,激发生物科学、药物研发、合成生物学方面的发展。Otz曹操读书网

我们在中学就已经简单了解过蛋白质了。蛋白质是生物构成的重要基本物质,由各种氨基酸组成,其排列方式和位置的差异使得其种类极其繁多,结构复杂。每种蛋白质的空间结构和功能都大不相同,也因为蛋白质的空间结构,不同的折叠方式使得蛋白质具有的活性和生物性能不定,而这个复杂的特性也就注定了研究蛋白质的路径困难重重。Otz曹操读书网

蛋白质研究的波折之路

蛋白质早在18世纪就被法国化学家发现,但是因为技术条件的限制,直到20世纪初,科学家才能根据一些技术去深入的研究蛋白质。因为蛋白质结构的复杂与种类极其繁多,研究了解的过程极其费时费力。Otz曹操读书网

对于早期的生化学家来说,研究蛋白质的困难在于难以获取大量的纯化的蛋白质用于研究,因此早期的研究工作就是在各种纯化蛋白质的路上。后来有生物公司1950年在牛胰腺中纯化了核糖核酸酶a,并免费提供给科学家使用,科学家的大量试验逐渐打开。Otz曹操读书网

1949年,英国生化学家桑格用8年的时间测试出了胰岛素(蛋白质)的51个氨基酸的排列顺序,验证了蛋白质是由氨基酸所形成的线性多聚体。因这一研究桑格被授予1958年诺贝尔化学奖。人们运用桑格的方法对许多别的蛋白质迅速进行了测序,桑格的研究为1965年第一次人工合成胰岛素铺平了道路。Otz曹操读书网

人类第一次知悉蛋白质分子结构是在1959年,英国科学家 Max Perutz 利用X射线衍射的方法,根据射线被散射的角度推测电子的位置解析了肌红蛋白分子的三维结构,自此之后,X射线衍射成为解析高分辨率蛋白质结构最有力的工具。除了X射线衍射之外,后期科学家们常用的研究工具还有核磁共振与冷冻电子显微镜技术。Otz曹操读书网

Otz曹操读书网

虽然有设备辅助研究,但是现实测试技术的局限,施行起来成本过高,按照传统的实验步骤,从基因序列到相应的蛋白质结构测定之间还要经过基因表达、蛋白质的提取和纯化、结晶、X射线衍射分析等步骤。由于蛋白质结构和性质的多样性,这些步骤大多没有固定的规律可循。Otz曹操读书网

历史上有科学家耗费几十年时间才能得到一个清晰的蛋白质三维结构,蛋白质三维结构的测定成了生物学领域非常困难的研究。至今为止没有AI技术的协助,三维结构被看清的量也仅仅只有17万个,这跟蛋白质的总量相比差距大的跟九牛一毛似的。Otz曹操读书网

对于蛋白质的结构来说,就算我们看得清测得出它的形态,但是关于其折叠的方向在三维空间中有10^300种方式,为何就选择折叠为现在的状态,这个过程和选择的路径没法解析。因为研究的方法与内容都极其困难,所以研究蛋白质的结构以及定性就真的只有死磕这一条路了。半个多世纪以来,研究蛋白质结构的相关工作只要有新的发现就会喜提诺贝尔奖,至今为止仅仅蛋白质领域已经拿过20多项诺贝尔奖。Otz曹操读书网

也有一批科学家跳出肉眼观测的技术思路困境,另辟蹊径,绕开费事费钱的传统技术的试验步骤,从蛋白质的氨基酸序列直接进行计算预测它们的三维结构。Otz曹操读书网

站在AI巨人肩膀上研发

实现从氨基酸预测蛋白质结构的大前提就是计算机技术的发展。1998年,华盛顿大学的 David Baker 教授开发了一套名为 “Rosetta”(罗塞塔石碑)的计算机程序来预测蛋白质结构。但是因为算力的有限,不能暴力地穷举,因此在早期的预测中,主要用来处理氨基酸数量很小、排列比较规则的蛋白质。对于复杂的蛋白质也只能望洋兴叹了。Otz曹操读书网

为了获得对蛋白质结构预测技术水平的客观评估,由马里兰大学的John Moult领导的一组科学家在1994年创立了CASP(结构预测的关键评估),预测者可以在一个双盲框架内评估他们的方法,以促进研究、监测进展,并建立蛋白质结构预测的最新水平。Otz曹操读书网

Otz曹操读书网

得益于卷积神经网络的发展,Deepmind的研究在第十四届CASP比赛中大放异彩,团队使用基于注意力机制的神经网络,依靠端到端的优化整体构建结构,内置了大量的序列、结构和宏基因组等多重比较信息,其预测的GDT-TS中值达到了92.4分,远远高于第二名。这是个什么水平呢?据悉,GDT-TS的得分在70分左右,说明其结果具有准确的全局和局部拓扑结构的模型。超过80分,结构细节的建模越来越正确,超过95分,模型就像根据实验数据建立的模型一样准确。Otz曹操读书网

人工智能技术作为预测蛋白质结构的辅助手段,通过暴力的学习穷举,将科学家本来需要几年几十年预测的时间缩短为几日,并且对于简单地蛋白质分子来说结构的预测已经非常精准,而这样的结局就会让科学家们转身投入到深度理解蛋白质本身的机理的研究中。Otz曹操读书网

纵观科学史,每次科学家在所在领域内取得重大的进步,都离不开当时技术的支持。无论是在蛋白质提纯的困难年代,还是观察蛋白质的冷电镜技术时代,科学家研究的工具都依赖于当时的最高科技水平。在AI时代,因为算力和算法模型的极大提升,我们见证了蛋白质结构预测的历史时刻。Otz曹操读书网

AlphaFold2的数据库现已开源并且还在不断地增加新蛋白质结构预测,这也成为了科学家进行蛋白质研究的宝藏数据库。不过算出结构也只是生物科学领域的初步阶段,指明了方向后续的进展还得需要试验与头脑的风暴。对于没有在已有蛋白质结构数据集训练的其他蛋白质结构,其研究仍然是谜一般的存在,这也给科学家们留下了很大的研究空间。Otz曹操读书网

不过AlphaFold2 这样的高精度模型,总的来说还是极大地推动科学家的研究与发展,拓展了对蛋白质进行功能分析、以及下游应用的范围,科学家们得以在各个领域展开开拓性的研究,比如一些癌症、病毒类感染的疾病研究,抗生素、靶向药的开发,研发新效率的酶等为健康与环保的层面做出贡献。Otz曹操读书网

站在神经网络与深度学习的技术巨人的肩膀上,生命科学领域的发展已经有了质的飞跃,AI对于蛋白质的预测也不再依赖人类的先验知识去做结构预测,相比几年前引起轰动的 AlphaGo,AlphaFold 也让深度学习与神经网络好好秀了把肌肉。科学的创新离不开技术工具的强力辅助,而蛋白质这个能够影响生命进程的分子,技术为我们打开了研究它的大门,这些海量的蛋白质结构信息被技术释放,背后的解读与分析可能蕴含着生命信息的密码。下一个生命科学领域的革命性研究成果,炸出来的是什么我们无法想象。在生命科学研究中体验开盲盒的快乐,也是从来没有想过的惊喜,期待下一个未来。Otz曹操读书网

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体AppOtz曹操读书网

Otz曹操读书网

核心关键字: 人工智能

相关文章

  • 他们,投了30位科学家,捕获40只独角兽
    他们,投了30位科学家,捕获40只独角兽

    联想创投迎来了第五个年头。“投了近200家高科技企业,斩获10个IPO,投出40家独角兽企业。”联想创投集团总裁、管理合伙人贺志强用了一组数字总结了过去五年历程。仅2020年,联想创投新增投资项目38个,总计出手近60次,投资收益更是创下历史新高。对于一家CVC(企业创投)而言,这样的成绩比起绝大多数财务VC/PE机构也是毫不逊色。从2016年成立的第一天起,坚持早期科技投资成为这个团队身上不可磨...

    2021-07-28 15:53:21
  • 动物肥胖基因也能让植物“变胖”?中美科学家成功使水稻、马铃薯增产3倍
    动物肥胖基因也能让植物“变胖”?中美科学家成功使水稻、马铃薯增产3倍

    图片来源@视觉中国文|学术头条,作者|ZS,编辑|王新凯食物是人类生存的基础,长期以来,人类生活最重要的工作就是获取食物。今天,生活富足的我们可能很难想象很多人基本的食物需求都无法被满足,吃不饱穿不暖的场景。而随着技术的进步和发展,中国早已不是以前那个贫弱的国家。如今,中国人均粮食的占有量在474公斤,远超国际标准400公斤的粮食标准的安全线,位居世界前列。同时,现如今的中国不仅解决了人们温饱问题...

    2021-07-27 19:50:12
  • 41岁潮汕科学家,即将坐拥一个IPO
    41岁潮汕科学家,即将坐拥一个IPO

    又一位80后科学家即将奔赴IPO敲钟。投资界获悉,本周奥比中光科技集团股份有限公司(简称“奥比中光”)申请科创板上市已获受理。大家可能鲜少听说过奥比中光,其实这只硬科技独角的产品正是我们日常生活经常用到的3D摄像头,2020年营收2.6亿元。鲜为人知的是,奥比中光背后是一位来自广东潮州的80后科学家。2013年,黄源浩辞去在国外稳定的工作,回国创办奥比中光。此后几年,他经历过公司没有收入、开不出工...

    2021-07-24 16:58:31
  • 重庆百货控股股东股权结构变更 背后竟无实控人
    重庆百货控股股东股权结构变更 背后竟无实控人

    作者:简丹来源:GPLP犀牛财经(ID:gplpcn)公告称,本次权益变动为重庆渝富控股集团有限公司为实施内部重新整合,将其持有的重庆商社(集团)有限公司(下称“商社集团”)的股权和重庆华贸国有资产经营有限公司(下称“重庆华贸”)的股权,无偿划转至其全资子公司重庆渝富资本运营集团有限公司(下称“渝富资本”)持有。(来源:重庆百货公告)此外,商社集团已实施员工持股计划,持股平台重庆商社慧兴企业管理咨...

    2021-07-23 17:52:35
  • 乳腺癌为何全球发病率最高?科学家发现294种潜在致乳腺癌物质
    乳腺癌为何全球发病率最高?科学家发现294种潜在致乳腺癌物质

    图片来源@视觉中国文丨学术头条,作者丨ZS,编审丨王新凯近年来,随着全球乳腺癌发病率不断升高,乳腺癌已经替代了肺癌成为全球癌症发病率最高的恶性肿瘤。世界卫生组织国际癌症研究机构(IARC)发布的2020年全球最新癌症负担数据显示:2020年全球新发癌症病例1929万例。其中一个最明显的变化是乳腺癌新发病例数的快速增长达226万,首次正式取代肺癌(220万)成为全球第一大癌症,占所有新增癌症患者的1...

    2021-07-22 19:55:06
  • 贵州发布能源结构调整基金管理办法,首期规模10亿元
    贵州发布能源结构调整基金管理办法,首期规模10亿元

    投资界7月21日消息,日前,贵州省能源局、贵州省财政厅联合发布关于印发《贵州省能源结构调整基金管理办法》的通知。通知指出,能源基金规模暂定为50亿元,带动金融和社会资本投资不低于200亿元。能源基金首期10亿元,由贵州省能源局从省能源结构调整等能源相关省级财政专项资金中安排出资,后续可根据能源基金实际运行情况,由省级财政安排出资。同时,新型工业化基金中能源版块的项目可推荐给能源基金进行投资。以下为...

    2021-07-21 19:04:19
  • 媲美AlphaFold2的蛋白质结构预测工具问世,可十分钟出结果
    媲美AlphaFold2的蛋白质结构预测工具问世,可十分钟出结果

    文|学术头条,作者|吴婷婷,编辑|王新凯如今,人工智能已经渗透到人们生活的方方面面,各种深度学习算法也越来越多地应用于各个领域。尤其在生物和医学领域,人工智能技术可以说大放异彩,极大加速了有关生物、病理等科学的发展,而其中一项重要的应用,就是预测蛋白质结构。蛋白质作为构成人体组织器官的支架和主要物质,在人体生命活动中起着重要作用。2020年,DeepMind在第14届“蛋白质结构预测关键评估”(C...

    2021-07-16 13:16:25
  • 三位科学家联手斩获一个IPO:康诺亚市值200亿
    三位科学家联手斩获一个IPO:康诺亚市值200亿

    又一位医药科学家站上了IPO敲钟舞台。投资界7月8日消息,今日,康诺亚生物正式登陆港交所,此次发行价为每股53.3港元,开盘大涨46.34%,开盘市值达211亿港元。康诺亚生物创始人之一陈博是医药圈内的传奇人物,他毕业于鼎鼎有名的爱因斯坦医学院,曾是复旦大学教授。在创立康诺亚生物前,陈博还是君实生物创始人。康诺亚生物是陈博第三次创业,这次团队阵容更加强大世界上第一个PD-1“O药”发明人王常玉、曾...

    2021-07-08 14:54:55
  • 徐吉军:董事长打科学家事件,怎么反转?
    徐吉军:董事长打科学家事件,怎么反转?

    七一百年庆典刚过,第二天网络舆情开始曝出航天投资控股有限公司党委书记、董事长张陶,殴打国际宇航科学院两位院士王晋年、吴美蓉的事件。事件因为双方的身份引起舆论高度关注,绝大部分人在看了张陶书记殴打王晋年长达十分钟的视频之后,都非常震惊。在殴打王晋年的过程中,张陶书记随手一推把85岁的吴美蓉女士推出去几米仰面朝天摔倒在地。吴美蓉女士被别人扶起来后一直手扶着腰,站不住。这把年纪,没有命丧当场,也算万幸了。在殴打王晋年的过程中,张陶书记发挥身高马大的特长,一身蛮力横冲直撞,两个下属拦都拦不住,实在是令人震撼。一个...

    2021-07-06 18:52:22
  • 结构性心脏病平台公司汇禾医疗完成数亿元 B 轮融资,IDG 资本领投
    结构性心脏病平台公司汇禾医疗完成数亿元 B 轮融资,IDG 资本领投

    近日,结构性心脏病平台公司上海汇禾医疗科技有限公司(简称“汇禾医疗”)完成数亿元人民币B轮融资,本轮融资由IDG资本领投,老股东国方资本、联想之星等持续加码,由上海科创基金,诺庾资本、香塘资本跟投,易凯资本担任独家财务顾问。汇禾医疗创立于2019年,创始人林林是心内科医生出身,多年来深耕结构性心脏病领域。通过上千台心脏瓣膜手术,她发现了瓣膜器械的临床痛点,总结出瓣膜器械的技术方向,将“一鞘双瓣”的...

    2021-07-02 09:51:39
留言与评论(共有 0 条评论)
   
验证码: