语言技术：AI皇冠上的明珠

2024.05.09 Ai芯天下

    语言环境是如此的复杂，而对于那些因受伤或生病而无法说话的人，我们怎样才能更好的理解他们的想法？他们又如何能更快更有效的表达自己的意图？
    语音和语言是真正镶在AI皇冠上的明珠，AI领域再没有比语音和语言研究更具挑战性的任务。让机器获得推理、理解能力，并通过阅读、交流获得知识，便是改善人类生活、提高人类生产效率，让这个世界不再有语言、沟通和理解障碍的最基本的研究领域。对人工智能来说，语音语言技术能够驱动人工智能进化。

    智能语音技术的前提条件
    语言是我们日常交流的主要方式，可以让我们快速了解对方的意图，并做出适当的反应。但对很多语言障碍者而言，说话这一看似简单的行为依旧是难以想象的困难。语言是件极其复杂的事情，不仅仅是文字表面上的发音，还与音量、音调、速度、说话环境等众多因素密切相关。
    由于深度学习、大数据和云计算三者的相互促进，才成就了语音技术的进步，成就了人工智能的浪潮。
    除了硬件，语音服务平台也迅速被建立，键盘作为输入系统即将被停留在上个时代，人类将直接用自然语言和机器进行交互，智能家居和车载用品将成为智能语音应用最集中的领域，也即将是人工智能率先爆发的市场。
    目前，人工智能目前已经可以提供语音识别、语言响应、智能推荐等功能。而基于用户的问题数据库和处理方式的数据库，未来很多公司的客服完全可以用人工智能来解决。

    应理解语音语音技术中的智能化
    在未来的某些时候，计算机能够理解三百种语言，还能够流利地交流和对话。而且，机器不仅能够流利地交流和对话，还能够领会、理解、学习、推论以及能够在所有科目上都能拿到博士学位。这种知识的获取、推论超过了任何人的个人能力。当这一刻到来的时候，可以想象人工智能将会有多聪明。
    这里的智能有两个层次。第一个层次是感知智能，它能看，能听，能闻。紧接着高层次的是认知智能。我们今天所取得的人工智能的突破，大多是在感知层面，例如语音识别、语音合成、计算机视觉。但是在高级推理和知识获取这些认知能力上，人工智能距离人类的水平还很远。
    从更长远看，语音、人脸等技术的长期空间，都是将原来只能通过设备传递、而不能被设备理解的语音、图片等信息，逐渐变成可以被机器理解分析的结构化数据，从而大大提高机器对人的了解，给人以更准确的推荐、提高各种信息服务的有效性此处最有想象空间。
    新技术正快速推动语音生成设备
    随着语音合成算法的进步及微处理器技术的发展，电子辅助和替代通信系统（AAC）得以快速普及。通信辅助设备也变得越来越小巧，功能也越来越强大。著名物理学家史蒂芬·霍金就使用语音生成装置与他人进行交流。
    在过去几年中，随着人工智能技术与语音技术的突破，以及数字设备功能的指数级增长，数字化语音正在改变人们的交流方式，特别是翻译和医疗等领域。
    据相关数据显示，2017年，语音生成设备市场规模为1．9亿美元，预计到2025年将达到3．3亿美元。
    ①智能手机、平板电脑和数字触摸屏为患者提供更加直接的交流方式。如自闭症患者可以通过触摸屏上的物品图像、活动图片或符号来表达他们的需求。
    ②机器学习、自然语言处理和文本预测技术极大地推动辅助通信技术的发展，语音合成应用可以为用户提供定制化、个性化的服务。
    ③现在科研人员正在通过脑机接口技术将之变成现实。目前脑控科技已经成为各国科研人员竞相研究的前沿课题。尽管大多数研究目前还停留在实验室阶段，一旦该技术成功商业化，瘫痪者、语言障碍者、盲人等群体将迎来生命中的第二个春天。

    1  2  下一页>