为了更懂人类，人工智能正在修炼的三大技术

2024.06.14 张康康

    人工智能自1956年Dartmouth学会上提出，在经历一个又一个寒冬之后，如今真正登上了人类舞台。当下，不论是计算机视觉、自然语言处理还是安全监控以及智能驾驶，人工智能技术的应用都近在咫尺，但那些一直期盼它能像人类一样具备思维的夙愿，至今却仍未实现，为了更懂人类，全球人工智能科学家都在冲击技术高点，不遗余力的为AI技术带来全新突破，这其中就包括近年来被认为会颠覆人工智能格局的三大技术。
    对抗性神经网络

    对抗性神经网络（Generative Adversarial Network，GAN）最早出现在2014年在蒙特利尔大学博士生Ian Goodfellow的学术论证中，他采用两个神经网络，支持大多数现代机器学习的人脑简化数学模型，让他们在数字游戏中彼此对抗。
    在这个过程中就会出现两个神经网络的角色，一个是生成网络（Generator），另一个是判别网络（Discriminator），前者负责不断生成内容，后者负责不断判别生成的内容，彼此互博，最终在长期对抗中提升各自的能力。经过长时间的互博结果，一个不断“造假”，一个不断“验真”，生成网络的“造假”能力剧增，产出的逼真内容已经让判别网络无法辨识。
    对抗性神经网络的关键性突破就在于，通过这种对抗机制，机器开始理解人类所看到和听到的世界结构，并最终赋予机器在创造一个全新的东西时所需要想象力，生成的结果非常逼真。
    目前，对抗性神经网络有两种应用，一是完全从无到有的生成逼真度极高的语音或者图像；另一个则是利用对抗性神经网络来改进已有传统的AI应用，例如超分辨率、照片自动美化、机器翻译等，包括Google Brain、DeepMind、Nvidia、Open AI都是这项技术的重要参与者。
    生物特征识别

    所谓生物识别技术就是，通过计算机与光学、声学、生物传感器和生物统计学原理等高科技手段密切结合，利用人体固有的生理特性，如指纹、指静脉、掌静脉、脸象、虹膜等，以及行为特征，如笔迹、声音、步态等，来进行个人身份的鉴定。
    由于人体特征具有人体所固有的不可复制的唯一性，通常属于私密安全范畴，这一生物密钥无法复制，偷窃或者遗忘，因而利用生物识别技术进行身份认定，具有非常高的安全性和准确性，而目前一些常见的口令往往都不免存在着被复制及被盗用的不利因素，因此采用生物特征作为识别的“钥匙”，能够大幅度提升识别效果以及降低安全风险。
    未来，伴随着生物特征识别技术的不断成熟，也将迎来全新的市场变化和需求，尽管单一的生物识别技术各有优劣，在安全要求较高的场景，仍旧存在提升空间，但目前而言，生物特征识别技术的应用正在各行业扩展开来，尤其在物联网的应用上会成为着力点，在配合安全、监控、管理系统整合，实现自动化管理上，市场前景广阔。
    情感计算

    情感计算的概念是在1997 年由麻省理工学院（Massachusetts Institute of Tech－nology，MIT）媒体实验室 Rosalind Picard 教授提出的，她的著作《Affective Computing》开创了计算机科学和人工智能学科中的新分支——“情感计算”，她指出情感计算与情感相关，是源于情感或能够对情感施加影响的计算。
    由于人类交流中80％的信息都是情感性的内容，而人工智能系统只有在对人类情感得到充分了解之后，才能发挥具备智力因素的情感反馈，实现真正的强人工智能。因而，情感计算就是要赋予机器类似于人一样的观察、理解和生成各种情感特征的能力，最终使让机器像人一样正确感知环境、理解用户情感和意图，以作出自然、亲切和生动的交互。这种技术手段的出发点是通过心理学、生理学、认知学、行为学和脑科学等相关的综合学科，来进行机器的情感化操作，在此基础上，人类需求分析、情感表达、人机交互才能成为可能。
    因而，传统的人机交互应用在情感计算的不断成熟中正在被逐渐迭代，通过语音情感识别、人脸表情识别和生理信号情感识别等，进行喜、怒、忧、思、悲、恐、惊七种基本情感计算，完成情感反馈，进而在情感语音合成、面部表情合成和肢体语言合成上具备精准结果。情感计算未来在医疗健康、安全驾驶、远程教育、智能家电等领域都具备超前的应用前景，赋予机器拟人化的工作状态，修炼“读心术”。尽管如此，目前情感计算领域存在的挑战还很多，包括情感获取与建模、情感识别与理解、情感表达等，亟待全球顶尖人工智能科学家带来最新突破。
    在AlphaGo获胜的那一刻，我们都不愿承认历经亿万年所进化的人类智慧被机器超越，但事实上，我们又希望冷冰冰的机器能凭借人工智能成为更懂人类的那个伙伴，我们期待的不仅仅是让机器“更智能”，还是“更像人”，当人工智能技术能够解决这些障碍时，他才能支撑起自己思维的物质世界。不论是微软小冰通过情绪特征感知而不断升级的共感模型、Facebook研究人员试图通过观看视频来教AI来理解现实、旷视科技正在从各个角度攻破视觉识别领域障碍、还是极链科技Video＋＋通过千万次训练来让AI理解视频内容所表达的不同情感等，都能看到人工智能研究者正在卯足劲向前，尽管我们要承认机器学习中的技能转移也许不总是有效，但正是这种与现实的差距，才能不断激励技术进步，未来仍旧可期。