微医原副总裁创业,哲源科技用超算构建生命信息引擎
动脉网赵宇发了一条朋友圈,这是他离开微医一年多后,首次公开自己的“新战场”:哲源科技,由中国科学院计算技术研究所孵化的一家构建生命数据解析平台的人工智能企业。
此前,赵宇在微医曾担任负责市场及战略的副总裁,多年深耕“互联网+医疗”领域。他认为,“医疗是人工智能最大的一个应用场景之一,随着科技的进步,人类在临床上积累的数据越来越多,以基因组为代表的数据产生量呈指数上升,数据更新日益加快、获取数据成本降低,当面对每个个体超百G的数据,累积数据超过PB级(1P=106G)时,我们如何解读这些多元、高维、海量、异构的信息,便成为了关键。”普通的小型计算机已经无法满足其分析和解读的需求,哲源科技便通过模型、超算技术来突破解读,认知的瓶颈。
基于此,哲源科技联合中国科学院计算技术研究所科研团队,推动以国家队的身份首倡并推动计算医学,所谓计算医学,是致力于发展定量方法,通过应用数学、工程学和计算科学来智能化理解人类疾病的机理,并基于工业化的数据、算法、算力及生物医学技术体系为医学服务提供新洞见。
通过构建人类的数字生命,让数据来表达人体的治疗后反应,这种设想已经不再是脑洞大开,而是哲源科技实实在在正在践行的项目,以计算机(超算)模拟人体内的信息交互,将生命变得可数据化,从而解读人体的生命数据,再利用其进行人体健康管理、药企新药研发等方面的应用。
不同于循证医学和精准医学,计算医学是一个全新的概念,高度依赖高性能的数据分析平台,是建立在超算基础之上的新兴科学。计算医学以计算技术为手段,医学问题为导向,构建各种生命活动的模型,充分利用人类已经积累的生物医学知识,系统地理解生物医学大数据蕴含的生命规律。
循证医学、精准医学、计算医学对比示意图(图片截自官网)
中科院计算技术研究所20年经验孵化,超算上跑出计算医学
中国在超算方面的成就中科院计算技术研究所(简称:中科院计算所)位于第一梯队,谭光明教授、张春明都是研究所里有着20年超算经验的研究员。中科院计算所多年以来一直积极参与国家课题,为配合人类基因组计划,开发了基因组学处理技术,建立了基因数据计算模型、融合模型等等,基于这些年积累,作为计算所高性能计算机研究中心主任,超算邻域的世界级科学家谭光明教授带领团队提出了计算医学的概念。中科院计算所决定将研究成果以企业的方式落地,遂孵化出了北京哲源科技有限责任公司(简称:哲源科技),将生物医学数据处理方面的人工智能社会化应用,构建生命信息引擎,向临床赋能。
除了前微医高管赵宇负责公司商业化落地,公司背后技术实力强大,张春明副研究员、牛钢博士是哲源科技的技术核心。牛钢博士目前担任图灵·达尔文实验室主任,曾经主持分析了世界上最大的肝癌PDC数据项目。
构建生命信息引擎,成就医学界的“英特尔芯片”,赋能全临床
“循证医学最大的特点是体现了群体的特征,但是却永远没办法知道药物对具体某个人的实际疗效如何。”哲源科技COO赵宇表示,“例如在判断肿瘤用药方面,我们需要大约25000个基因,例如针对乳腺癌的分类和治疗方案的选择,可能就涉及三千多个基因,在目前实际场景中,如果说患者没有标志物,那么即便是精准医学也束手无策,最后又回归到循证医学。” 而在计算医学的方法论下,哲源科技不再是依赖某个单独的基因作为判断药物疗效的关键,也不局限于靶点和药物之间的一对一单点的因果关系,而是系统性地看待生命,最终哲源均能够给出用药建议方案,用超算手段去挖掘驱动找到新重点,然后结合人工智能的方法做算法迭代输出,去探寻整体机体体系间的相关关系,构建出一个生命信息引擎。
而训练这个模型的数据体量,按赵宇的描述,已经超过PB(1P=106G)量级,每次系统迭代都需要耗费千万级的电费。“生命信息引擎并非‘海市蜃楼’,我们已经有部分成果在临床上获得了佐证。”赵宇告诉动脉网。
就在最近,哲源科技通过生命信息引擎的子系统TWIRLS分析了世界上有关冠状病毒的1.4万多篇文献相关文本资料共计300万余单词,在没有任何临床资源情况下,四小时就找到了新冠病毒导致“细胞因子风暴”的潜在机制,进而明确指出一个治疗的新靶点。
无独有偶,一个月后,这一计算医学方法下的“纸上谈兵”的研究结论,在3月25日Research Square平台的一项由上海瑞金医院病理科教授王朝夫、中国科学院院士卞修武等为通讯作者的论文中得以验证。更在其后中国医学科学院蒋澄宇团队以及武汉大学基础医学院李红良团队分别回顾性研究中进一步验证。
生命信息引擎可以生动地理解为医学界的“英特尔芯片”,理论上可以为全医疗领域的各类细分疾病进行数字化模拟试药,即便面对棘手的癌症,计算医学呈现出巨大的优势。
肿瘤之所以难以治愈,原因在于癌症并非由单一的基因控制,而是由上万基因共同作用的结果,这些基因还会在体内突变、演化,并且都不是“孤军奋战”,相反他们作为通路形成“种群”,联合去完成特定任务。攻克癌症,就好比要去解析一个超级复杂的电子路线图,试图通过单基因的管控实现全癌症治疗难度可想而知。
BBC纪录中将癌症信号通路形容成“你见过的最复杂的电子路线图”
哲源科技通过机器学习模型深度解读肿瘤基因组全局性变异,评估肿瘤信号通路的激活状态,可对肿瘤进行分期、评估原发灶起源、预测肿瘤进展等情况,辅助医生与患者选择靶向药物、化疗药物、免疫治疗药物,评估用药疗效。特别是针对一线及多线用药失败、基因检测无可用药提示、检测到用药变异但临床效果不好、发生耐药等肿瘤临床疑难问题,为医生提供可用药方案、辅助优化后续临床治疗方案,实现肿瘤全程精准诊疗。
哲源科技的肿瘤临床产品和服务
目前,哲源科技已经有了多项临床产品输出,在临床肿瘤方面,区别于目前存在的基因分析,哲源科技用计算医学的方法,针对实体肿瘤复杂的二三线治疗以及耐药、转移等情况,可以全部给出用药建议,无空白、阴性报告,临床有效缓解超过百分之八十。
在赵宇看来,没有失败的药物临床三期试验。“我们通过计算医学,在医院场景下,要为人找药,对药企合作,则是为药找人,要给药装上‘眼睛’,找到适合的患者。哲源科技可以帮助临床试验失败的药物找到新的适应症,帮助药企将巨额的投入成本捞回来。”
“在计算医学方法下,我们已经提出了与医院,互联网医疗,第三方医学检验所三个医疗场景下的肿瘤治疗解决方案,但我们仍然希望临床医学科学家,药企研发团队带着问题与我们的技术合作,也希望将我们成熟的肿瘤临床用药建议产品丰富到各个基因检测公司的产品线中去。”赵宇呼吁道。据悉,公司也启动了新一轮的融资计划,主要用于科研团队的扩增以及多场景的产品合作推进。