DeepMind构建了一个可预测蛋白质折叠方式的人工智能


    该组织透露,它已经建立了一个人工智能系统,能够应对当今生物学中最大的挑战之一:模拟蛋白质的形状。
    该系统被称为AlphaFold,开发时间不少于两年。在美国国家综合医学科学院(U.S. National Institute of General Medical Sciences)举办的CASP模拟竞赛中,该软件轻松击败其他97种算法,随后DeepMind决定宣布该项目。
    几乎在每个生物过程中都会发挥作用的蛋白质是扭曲和折叠成各种形式的氨基酸链。蛋白质的形状是决定其行为的主要因素之一。更好地了解这些特性可以让科学家获得对某些疾病的新见解——这些疾病被认为是由错误折叠的蛋白质引起的,而且还会发现可能对药物开发有用的分子。
    DeepMind表示,AlphaFold代表了朝着实现这一目标前进的“重大进展”。该系统可以根据所包含的氨基酸计算预测蛋白质的结构,这家Alphabet的子公司表示其准确程度远远高于现有方法。如果是手动模拟平均大小的蛋白质的每一种可能的结构,要花的时间比宇宙的年龄更长,考虑到这一事实,这种算法取得的成就就不是一件小事了。
    AlphaFold将任务分解为两部分。首先,系统使用有关蛋白质的氨基酸组成的信息来生成其默认(即展开)结构的三维模型。
    DeepMind解释说:“我们网络预测的属性是:(a)氨基酸对之间的距离和(b)连接这些氨基酸的化学键之间的角度。”他们表示:“我们训练了一个神经网络来预测蛋白质中每对残基之间距离的单独分布。然后将这些概率组合成一个分数,评估该蛋白质结构的准确程度。”
    三维模型准备就绪之后,AlphaFold就会计算出该蛋白质最有可能的形状。所有蛋白质倾向于折叠成尽可能最节能形式,该系统利用这一事实来完成这一步工作,这有助于缩小可能性。 人工智能会尝试不同的三维模型变体,以生成更高效的版本,直至找到最佳形式。
    DeepMind表示:“我们的第一种方法建立在结构生物学中常用的技术基础之上,并用新的蛋白质片段反复替换蛋白质结构片段。”他们表示:“第二种方法通过梯度下降优化得分——一种常用于机器学习的数学技术,用于进行小的、渐进式的改进——以产生高度精确的结构。”
    据英国《卫报》(The Guardian)报道,AlphaFold最初需要两周时间才能产生预测,但现在可以在几个小时内完成任务。它在CASP模拟竞赛提供的43种蛋白质中,准确预测了25种,成功击败参与测试的其他97种算法。其中亚军只正确预测了三个。