AI与基因科学的对话:高岭之花如何“接地气”

智能相对论

    
    有人的地方就有江湖,巨头们一次次的“技术战役”就是现代江湖的样子。各家企业牢牢把握住科技就是第一生产力的关键,不断的较量平台、技术、场景、生态等多方面的综合实力,你方唱罢我登场好不热闹。
    在我们的认知中,基因科学和人工智能都是技术中的“武林高手”。在一系列新闻通稿中,二者通常会与“长生不老”“返老还童”这样的字眼搭边,颇有一种笑傲江湖的感觉。
    而细细去比较两者——人工智能正处在关键时刻,多多少少已经渗透进了人们的生活,但基因科学总是“只闻其声,不见其人”,犹如高岭之花,被封存在科学家的实验室里,少有人接触其核心技术。
    广阔天地,谁能大有作为?人工智能与基因科学短兵相接,是取得友好合作,还是一拼高下?在这场世纪瞩目的“华山论剑”中,智能相对论行业分析师颜璇开了个脑洞。
    从高岭之花到花开遍野
    目前,人工智能的产业图谱已经十分丰富了,金融、教育、医疗、公共安全等领域都可以看到AI的影子。从这一点来看,基因科学虽然是AI的前辈,“名震江湖”的速度却没有后辈来得快。
    基因科学的应用通常集中在基因检测。基因检测有两个应用场景,一个是健康检查,比如预测癌症等,不过这一般是富人追捧的高端体检服务,让它“一战成名”的就是安吉丽娜·朱莉通过基因测序检测出了自己罹患乳腺癌的风险;另一个则是商业化的“算命式”基因检测,比如通过基因测试你的孩子有没有唱歌天赋等,拳王邹市明的儿子就做过这样的测试。
    但这也不代表人工智能略胜一筹。生命科学这一领域限于研究环境、技术条件等壁垒,在前几年着实发展缓慢,但是在近些年,生命科学的高科技可能就要进入一个爆发期了。比如基因编辑,大家熟知的就有明星技术CRISPR/Cas9,在去年,Mitalipov领导的国际研究团队就完成了美国第一例人类胚胎基因修饰的研究。
    生命科学领域的想象力空间会非常大,当然,这类技术也会遇到和AI同样的伦理道德的牵绊。如此来看,AI或者基因科学“单打独斗”都会成为江湖中的一条好汉,但是,综合二者的拿手好戏和一些缺陷,这两位高手强强结合似乎更有看头。特别是在二者都想攻下的医疗领域里,更是有大显身手的机会。
    1.疾病诊断上,AI与基因相辅相成
    某个基因与疾病的相关性是根据统计学统计出来的。比如研究癌症和人体基因的关系时,首先要统计大量癌症患者的基因数据,然后进行比对,再筛选出相似的基因,即选定可能致癌的基因。
    但这样的结果却很容易被推翻,首先是因为统计数据是通过以往的累积数据统计的结果。而随着癌症统计样本数量不断增加,人们会发现更多的相似基因位点,患有癌症的概率统计也就会相应地发生变化。
    其次,人类患有某种疾病还与其它因素有关,比如肺癌的患病就和大气污染有很强的关联性。但是基因检测是接触不到患者的实际情况的。
    也就是说,即使基因检测获得了大量数据,对于疾病的指向性依旧是有限的。而面对这样的情况,我们加入AI能够深度学习To C端数据库的功能或许会有助益。
    就拿最近美国斯坦福大学开发的AI预测死亡系统举例,这个系统统计了12个月内死亡患者的近200万份医疗数据,然后通过深度神经网络利用大数据计算每条信息的权重和强度,与现有的患者进行比对,就会生成这个患者在3—12个月内死亡的概率分数。如此,也能最大限度地保证疾病诊断的正确率。
    除此之外,AI可以通过ChatBot、场景识别等功能,对患者进行行动上的监管,更有利于辅助基因的诊断。
    2.制药业的神助攻
    英国伦敦大学学院的皮特.柯文尼教授称:“通过病人的基因组序列,可以推断出酶的形状,构建准确的蛋白质三维结构,筛选匹配药物,并将结果告诉主治医生给出最优处方。”
    将基因测序技术和AI的计算能力相结合,或许能够探索出制药业的新路径。以艾滋病的治疗药物举例,科学家表示,目前他们建立的50多个模拟模型,就要配有5000个处理器的计算机不停的计算12-18个小时,还要对计算结果做大量的数据分析,才能给出药物的排序。而在制药这件事上,AI正在全面提升人类的效率。
    3、个人健康管理终端
    基因芯片一直是生命科学领域想要打造的“法宝”。而将其与AI结合起来,会在哪个方面实现突破呢?健康管理。
    基因芯片可以快速、准确的鉴定一个人的生物信息。与AI只能图像识别不同,智能终端+基因芯片或许可以打造出一个人类GIS智能设备,这个丰富的多维度的信息嵌合体可以用来解读个人的健康情况、识别个人的身份信息等。相当于有了一张智能的、专属的、可见的“基因身份证”。
    这类设备还可以快速检测污微生物或有机化合物对环境、人体、动植物的污染和危害。基因芯片经过改进,能够利用不同生物状态表达不同的数字信息,基于基因芯片和基因算法,还可用于制造生物计算机。 
    从AI“类人”的圈子里跳出来
    一方面,在基因科学中,解读人类基因程序语言的意义在于解读地球生物圈的程序代码。我们在教科书上就学过,基因是编译氨基酸的密码子。除了极少数的不同之外,地球上已知生物的遗传密码均非常接近。因此,根据演化论,遗传密码应在生命历史中很早期就出现。而这一点,对研究物种的诞生有着非常重要的意义,在以后,我们不排除“人造”地球生物圈的可能性。
    另一方面,我们目前提到的机器人、计算机等人工智能是没有意识的,即使我们不断地尝试,想让AI变得更像人,但机器所做的主要还是认知的事情,做的是一个Pattern Recognition,听听声音,看看图像。人脑的高级功能还是无法移植到AI上。自深度学习以来,AI一直没有重大的理论突破,也证明了创造出具有意识、情感的非生命还是很难的。
    美国哲学家约翰·希尔勒曾经提出“中文房间”的实验理论来反驳电脑和其他人工智能能够真正思考的观点。在这个思维实验里,只要计算机拥有了适当的程序,理论上就可以说计算机拥有它的认知状态以及可以像人一样地进行理解活动。
    在这个理论基础上,我们或许可以开一个比较大的脑洞,就是跳出人工智能一定要作为仿生机器、“类人AI”而出现的圈子,而是利用动物的思维,模拟动物的程序,这或许会是一个具有极大潜力的空间。
    来自澳大利亚新英格兰大学的基尔斯蒂·阿尔伯特就曾惊叹于蚂蚁的智能,“蚂蚁比我们想象的要聪明太多——我们把蚂蚁叫做超个体, 因为他们形成了许多与人类大脑类似的网络。” 的确, 与人类的社交系统相比,蚁群的社交系统相当的精密。
    如果把这个“人造”生物圈当作一个生物进化的实验工厂,那么我们或许可以从中总结出一套有别于人类的某个物种的程序语言,要说明的是,这种动物专属的程序是一直存在的,比如蚂蚁的社交行为,只是在进化过程中没有动物会自己总结下来。当人类能够纵观整个生命历史时,总结归纳一个物种的程序语言也未尝不可,而那意味着人类能够创造以新的程序语言为基础的“动物智能”。
    与其让AI不断进行人工标签数据的积累学习,不如先构建一个动物行为的知识图谱,进行系统化训练,一旦训练成功,对于人们来说,受益将会是永久性的。
    最重要的是,当基因科学获得突破,人类将有机会获得动物、植物的非公式性变量波动(即情感波动),那么,将这样的波动作为数据库植入到AI中,或许可以解决我们在日常生活中动物语料库不足、语义不明晰的问题。如果动物存在真情实感,通过基因技术+AI技术,我们或许可以实现人与动物的情感交流。
    不论如何,AI和基因科学迟早会实现花开遍地,而人类对于科技和自然的探索,就像时间之矢一样,永远向前。
    文 | 颜璇