人工智能众包数据以加速药物发现
胡说科技新的加密系统可以让制药公司和学术实验室共同合作,更快地开发新的药物,而不会向竞争对手透露任何机密数据。
该计算系统的核心是一种称为神经网络的人工智能程序。AI研究哪些药物与人体内的各种蛋白质相互作用以预测新的药物蛋白质相互作用的信息。
更多的培训数据产生了更聪明的人工智能,这在过去是一个挑战,因为药物开发人员通常不会因知识产权问题而共享数据。研究人员在10月19日的“ 科学”杂志上报告说,新系统允许人工智能将数据众包,同时保持信息的私密性,从而鼓励合作伙伴加快药物开发。
确定新的药物蛋白质相互作用可以揭示各种疾病的潜在新疗法。或者它可以揭示药物是否与非预期的蛋白质靶标相互作用,这可能表明药物是否可能引起特殊的副作用,匹兹堡大学的计算生物学家Ivet Bahar说,他没有参与这项工作。
在新的AI培训系统中,从研究组汇集的数据在多个服务器之间进行分配,每个服务器的所有者看到的似乎只是随机数。“这就是加密魔法发生的地方,”位于夏洛茨维尔的弗吉尼亚大学的计算机科学家大卫吴说,他没有参与这项工作。虽然没有个体参与者能够看到组成训练集的数百万种药物蛋白质相互作用,但是服务器可以共同使用该信息来教导神经网络来预测先前看不见的药物蛋白质组合的相互作用。
“这项工作具有远见卓识,”伊利诺伊大学厄巴纳香槟分校的计算机科学家简鹏说。“我认为它将为生物医学合作的未来奠定基础。”
麻省理工学院计算生物学家Bonnie Berger及其同事Brian Hie和Hyunghoon Cho通过在大约140万个药物蛋白质对上训练神经网络来评估他们系统的准确性。这些对中的一半来自已知药物蛋白质相互作用的STITCH数据库; 另一半包含不相互作用的药物蛋白质对。当显示已知相互作用或不相互作用的新药物蛋白质对时,AI选择哪些组以95%的准确度相互作用。
为了测试该系统是否能够识别迄今未知的药物蛋白质相互作用,Berger团队随后在近200万个药物蛋白质对上训练神经网络:已知相互作用的整个STITCH数据集,以及相同数量的非相互作用对。经过充分培训的人工智能建议进行了几次以前从未报告或已报告但未在STITCH数据库中进行的互动。
例如,AI鉴定了雌激素受体蛋白与开发用于治疗乳腺癌的药物(称为屈洛昔芬)之间的相互作用。神经网络还发现了白血病药物伊马替尼与蛋白质ErbB4之间从未见过的相互作用,该蛋白质被认为与不同类型的癌症有关。研究人员证实这与实验室实验相互作用。
该安全计算网络还可以鼓励在药物开发之外的领域中的更多协作。彭说,医院可以分享机密健康记录,以培训预测患者预后或设计治疗策略的人工智能项目。
“无论什么时候你想研究大量的人的行为,基因组学,医疗记录,法律记录,财务记录,任何对隐私敏感的东西,这些技术都非常有用,”吴说。