张建伟:产学研一体化,实现人工智能卓越未来


    8月30-31日,由中国高科技行业门户OFweek维科网、高科会主办,OFweek人工智能网承办的2018中国(上海)国际人工智能展览会暨OFweek(第二届)人工智能产业大会在上海跨国采购会展中心成功举办。
    本次大会共汇集了人工智能领域的国际知名企业高层、行业资深专家、专家分析机构等数千位精英,用全新视角透析行业动态,解读人工智能领域本年度海内外最值得关注的学术与研发进展。
    在30日主论坛:AI技术专场上,德国汉堡科学院院士张建伟为现场观众带来了《AI赋能,人机共融》主题演讲,从人工智能发展现状、人工智能未来挑战及发展策略等多个角度进行了具体探讨。
    
    德国汉堡科学院院士张建伟
    张建伟表示,人工智能技术发展迅猛,与过去相比算力巨幅提升。目前已经深入人们生活方方面面,包括制造业、交通、医疗、农业、建筑等等。
    演讲中,张建伟还表示,“人机融合”给人们带来许多机会,也给人们带来人才培养和跨界融合等挑战。如今正处于人工智能和机器人发展最好的时代,只有将产学研结合,将人工智能和机器人各垂直领域合作共享,才能在新的平台上实现创新突破,实现人工智能卓越的未来。
    以下为张建伟先生的现场演讲内容,OFweek人工智能网作了不改变原意的整理和编辑:
    大家下午好!首先热烈祝贺OFweek上海人工智能展会的召开,今天我给大家带来“AI赋能,人机共融”的主题演讲。首先给大家回顾一下,为什么人工智能如今发展愈发火热,在各项垂直领域中人工智能技术的应用前景及其发展重要性,最后为各位总结一下未来人工智能带来的挑战和发展策略。
    如今人类生活中对未来生活需求繁多,除了人工智能技术以外,新材料、VR、机器人、可穿戴设备等各项新技术的发展,都给未来生活方式带来了新的挑战。刚才几位专家都谈到了算力的问题,如今人工智能技术提供的高性价比计算能力,已经是我三十年前在清华学计算机时的100万倍。
    目前,从大数据技术发展来看,已从手工数据处理逐渐演变为半自动处理,数据自动分类和自动决策,大数据技术发展为人们处理未来生活的场景带来新的机会,包括智慧工厂、无人化智能制造,以及智慧社区等交互场景。目前我国把人工智能作为下一代重点发展领域,人们更需要努力把握机会。刚才讲到安防技术在自动驾驶中的应用,实际上在未来的制造业、交通、医疗、农业、建筑等方面,都存在巨大的机遇。
    以制造业为例,目前中国的制造成本在逐渐提高,未来如果没有人工智能的帮助,大部分大型制造工厂极有可能搬迁到印度等制造成本相对较低的国家。所以人们现在面临的问题是如何把人类的空间、物理的空间以及计算机人工智能理解的空间这三个空间进行统一的表达。
    国家自然科学基金委现在也新增加了关于“人机共融”的研究项目,我有幸和丁汉院士一直来协调这个研究项目,目前已经进进展到第三年。未来或将应用在智能制造、康复机器人、太空作业、智能安防等多个领域。目前新一轮的人工智能热潮是由于机器学习带来了新的动能,除了DeepLearning之外,我们还有其他几种重要的强人工智能学习方式,包括基于符号的、基于分析的、基于贝叶斯的以及基于动态进化的,所以未来的人工智能方向实际上是融合深度学习和符号知识的一个发展趋势。
    从机器学习发展方向来看,人们常说的CPS系统最早应用了机器自动化技术,随着软件数据增多,监督学习也逐渐在驱动过程中强化。在模拟人类大脑、视觉、听觉和触觉方面,人们将人工智能计算算法逐渐转化成人工智能的控制算法和硬件以及简化深度学习。
    从图像处理来看,我举几个央视“机智过人”节目的例子,比如人脸识别还有哪些挑战?刚才的报告提到了高宽带、高动态显示、模糊图像识别,这里提到的人工智能系统还达不到强人工智能的标准。在第一集“机智过人”中,林警官利用他对人脸理解的强大人类智能,画出了孩子的想象中的模糊图像,利用这幅图像成功锁定了孩子的父母。这种深度学习和未来知识外推的能力,正是弱人工智能走向强人工智能的需求。
    从大图像识别来看,在医疗行业里人工智能已经能和水平较高的医生展开竞争。比如医疗诊断、特殊疾病诊断,现在人工智能已经可以超过人类医生。但在整个通用诊断中,人工智能和真正的人类医生还相差很远。此外,深度图像识别还可以应用在其他领域,比如手机扫描识别任何一种植物、基于大数据的文本学习,比如微软小冰写诗,微软小冰阅读了三十几万首现代诗,给它一幅新的图像,它就能顺应主题写出漂亮的诗句。
    另外就是单模态训练。从网上下载撒贝宁两个小时的说话声音,利用他的声音来进行单模态训练,就可以模拟出逼真的声音,还可以应用在歌声中。但是未来真正的深度融合并非如此简单,除了感知方面应用以外,更重要的是CPS系统中物理世界的应用,如何真正发挥好“人机共融”技术,把人工智能变成可解释的、透明的强人工智能是目前最大的难点。
    人工智能和通讯设备给传统CPS系统插上了一双翅膀,在很多情况下可以实现更丰富的功能,而不增加其机电系统复杂度。刚才谈到人工智能已经从应用技术进入应用场景,一些基础研究项目比如深度学习、跨模态学习、强化学习、人脑建模、心理模型以及知识表达等都属于应用技术。人们还把人工智能技术加入感知系统、机器人、自动驾驶、智能制造系统关键模块、定位导航以及人机安全等,最后和人们衣食住行制造进行深度融合,这就是人工智能的应用场景。
    目前,我们启动了中德有史以来规模最大的人工智能基础项目合作:跨模态学习。大家可以看到多传感器融合和多模态交互的技术进展,以及未来的交互形式,从键盘到语音到图像最后全面融合,未来机器人和电子电气交流或许就是这种方式。
    在这个过程中,如何把人类的空间、物理的空间以及计算机人工智能理解的空间进行融合是个严峻的挑战。考虑到多模态信息表达和整个框架融合,我们用多模态交叉的形式来考虑自上而下的控制。用深度脑科学、心理学的办法研究未来人工智能基础算法,以及如何打造公共模块。关于机器人和深度学习我也写了几本书,从移动机器人到各种各样的机械臂和整个智能系统里的公共模块。在“机智过人”节目中有几个例子,如何让整个感知和驱动融合为一个系统、人和机器人如何进行篮球比赛、用视觉技术来感知快速运动的球等等。这些挑战都超越了深度学习的范畴。但目前在动态的环境里,人工智能机器人和人类的差距还非常大。
    其次是在多智能体协同合作方面,通过智能无人机和三个人操作的遥控飞机进行比拼,实现飞行过程中自动锁定目标,然后跟踪目标,最后撒网捕捉目标,展示了未来多智能体互相合作的场景。
    现在机器人之间也可以互相学习,通过互相学习能够快速达到机器人展现新型智能的要求,包括在农业里的自动识别、自动喷洒农药、自动收割等,都说明人工智能已从单纯识别感知进化到了系统全面运作。我们在与欧盟合作的科研项目中也做了移动机器人规划,比如移动操作服务、机器人和老人互动、室内室外机器人互动场景以及服务机器人助老助残的应用。另外,把深度学习和机器人结合,让服务机器人表达多种人类基本知识,例如学校图书馆的服务场景,机器人得到学生的命令要一本书,最后给他取两本书出来。在这种不断的学习的过程中,使人机交互所需时间越来越短,机器人和环境模型的校准程度越来越精确。
    现在所谓的连续学习技术是在深度学习和增强学习之后,除了输入输出的这种普通学习模式之外,针对每个状态节点和决策系统的价值评估,用这些评估来做连续学习。索尼最近公布了新一代的索尼机器狗,它就用上了连续学习技术,这说明现代机器人已经开始从增强学习往连续学习方向发展。
    迁移学习也是一个走向强人工智能的重要方法,它能使机器学习的效能更强大。比如我们自主开发的动态行走机器人,从教它走平地到教它走非平地的过程,从多模态操作方面实现了基于触觉、视觉的灵巧操作,未来的机器人实验会变得更有效、更灵巧。此外,在医疗和康复中人工智能应用也不在少数,配药自动化、机器人做手术、机器帮助患者实现术后康复等等。
    除了医疗场景以外,再看看以下场景,这是融合被动和主动打磨两种模式的新型打磨机器人。这是我们做的高性能自平衡机器人,把它转化成柱型装置,通过多模态的学习和控制理论,最后变成一种创新产品。未来的工程医院和工程修复也给我们人工智能平台和机器人应用提出了重要的挑战。
    “人机融合”给我们带来许多机会,也给我们带来人才培养和跨界融合中许多挑战。我们现在处在人工智能和机器人最好的时代,我们要把把产学研结合,在新的平台上实现创新突破。
    最后我祝愿大家在人工智能和机器人各垂直领域的多合作,多共享,实现人工智能卓越的未来。