语言技术:AI皇冠上的明珠
Ai芯天下语言环境是如此的复杂,而对于那些因受伤或生病而无法说话的人,我们怎样才能更好的理解他们的想法?他们又如何能更快更有效的表达自己的意图?
语音和语言是真正镶在AI皇冠上的明珠,AI领域再没有比语音和语言研究更具挑战性的任务。让机器获得推理、理解能力,并通过阅读、交流获得知识,便是改善人类生活、提高人类生产效率,让这个世界不再有语言、沟通和理解障碍的最基本的研究领域。对人工智能来说,语音语言技术能够驱动人工智能进化。
智能语音技术的前提条件
语言是我们日常交流的主要方式,可以让我们快速了解对方的意图,并做出适当的反应。但对很多语言障碍者而言,说话这一看似简单的行为依旧是难以想象的困难。语言是件极其复杂的事情,不仅仅是文字表面上的发音,还与音量、音调、速度、说话环境等众多因素密切相关。
由于深度学习、大数据和云计算三者的相互促进,才成就了语音技术的进步,成就了人工智能的浪潮。
除了硬件,语音服务平台也迅速被建立,键盘作为输入系统即将被停留在上个时代,人类将直接用自然语言和机器进行交互,智能家居和车载用品将成为智能语音应用最集中的领域,也即将是人工智能率先爆发的市场。
目前,人工智能目前已经可以提供语音识别、语言响应、智能推荐等功能。而基于用户的问题数据库和处理方式的数据库,未来很多公司的客服完全可以用人工智能来解决。
应理解语音语音技术中的智能化
在未来的某些时候,计算机能够理解三百种语言,还能够流利地交流和对话。而且,机器不仅能够流利地交流和对话,还能够领会、理解、学习、推论以及能够在所有科目上都能拿到博士学位。这种知识的获取、推论超过了任何人的个人能力。当这一刻到来的时候,可以想象人工智能将会有多聪明。
这里的智能有两个层次。第一个层次是感知智能,它能看,能听,能闻。紧接着高层次的是认知智能。我们今天所取得的人工智能的突破,大多是在感知层面,例如语音识别、语音合成、计算机视觉。但是在高级推理和知识获取这些认知能力上,人工智能距离人类的水平还很远。
从更长远看,语音、人脸等技术的长期空间,都是将原来只能通过设备传递、而不能被设备理解的语音、图片等信息,逐渐变成可以被机器理解分析的结构化数据,从而大大提高机器对人的了解,给人以更准确的推荐、提高各种信息服务的有效性此处最有想象空间。
新技术正快速推动语音生成设备
随着语音合成算法的进步及微处理器技术的发展,电子辅助和替代通信系统(AAC)得以快速普及。通信辅助设备也变得越来越小巧,功能也越来越强大。著名物理学家史蒂芬·霍金就使用语音生成装置与他人进行交流。
在过去几年中,随着人工智能技术与语音技术的突破,以及数字设备功能的指数级增长,数字化语音正在改变人们的交流方式,特别是翻译和医疗等领域。
据相关数据显示,2017年,语音生成设备市场规模为1.9亿美元,预计到2025年将达到3.3亿美元。
①智能手机、平板电脑和数字触摸屏为患者提供更加直接的交流方式。如自闭症患者可以通过触摸屏上的物品图像、活动图片或符号来表达他们的需求。
②机器学习、自然语言处理和文本预测技术极大地推动辅助通信技术的发展,语音合成应用可以为用户提供定制化、个性化的服务。
③现在科研人员正在通过脑机接口技术将之变成现实。目前脑控科技已经成为各国科研人员竞相研究的前沿课题。尽管大多数研究目前还停留在实验室阶段,一旦该技术成功商业化,瘫痪者、语言障碍者、盲人等群体将迎来生命中的第二个春天。
1 2 下一页>