普华永道最新观点：2018年人工智能技术十大趋势

2024.07.07

    2018年4月24日，普华永道发布最新《2018年人工智能技术十大趋势》（Top 10 AI technology trends for 2018）。报告显示，我们身处一个巨变的时代，毋庸置疑，人工智能（AI）已经成为科技前沿之一，将给许多行业带来颠覆性的影响，也有可能在未来重塑公司的人才战略、运营模式以及与客户的合作模式。商业领袖都已未雨绸缪，着手研究人工智能将如何影响他们的商业战略，以防被第四次工业革命的浪潮甩在身后。
    事实上，深度学习与增强学习在日常生活中的应用很多，例如机器翻译是对文本数据的处理；Siri等是对语音数据的处理；自动驾驶是对视频数据的处理；人脸识别则是对图像数据的处理，许多美颜APP都具备给图片添加可爱贴画的功能，这即是对图像进行识别，自动甄别出用户面部器官，用户即可随意处理图片，达到美化或娱乐的效果。
    但是目前实验室又在发生什么呢？可以预见的是，那里的研究人员的发现将会决定人工智能未来一段时间的发展进程。普华永道人工智能加速器（AI Accelerator）研究团队和诸多技术专家及商业领袖一样，正密切关注人工智能技术的领先发展。
    以下是亿欧智库带来精选推荐：
    普华永道：2018年人工智能技术十大趋势
    01 深度学习：揭秘神经网络的工作原理
    简述：模仿人类大脑的深度神经网络展示了它们可以从图像、音频和文本数据中“学习”的能力。然而，即使应用已超过十年，关于深度学习我们仍然有很多不明白的地方，包括神经网络如何学习、为什么它们的表现如此出色等。现在，这种状况有可能会改变，这要归功于将信息瓶颈理论应用于深度学习的新理论。信息瓶颈理论认为，深度神经网络在学习过程中像把无用信息从瓶颈中挤压出去一般，去除噪音信息，而只保留这些噪音所表达的真正信息。
    意义：精确地理解深度学习的工作原理，将有助于使其得到更大的发展和应用。例如，深度学习可以为网络设计优化和架构选择提供参考。可以肯定的是，通过探索深度学习理论，更多的场景应用能够被激发，并应用到其他类型的深度神经网络和深度神经网络设计中。
    02 胶囊网络：模拟大脑的视觉处理优势
    简述：胶囊网络是一种新型的深度神经网络架构，它能够用与大脑相同的方式处理视觉信息，这意味着它可以识别特征之间的逻辑和层次结构关系。这一特性与卷积神经网络形成鲜明对比。卷积神经网络是最广泛使用的神经网络之一，但它不能考虑简单和复杂特征之间的重要空间关系，导致错误率较高并经常出现误分类现象。
    意义：对于典型的图像识别任务，胶囊网络通过减少误差，保证了50％的较高准确性，同时胶囊网络也不需要那么多的训练样本数据。预期可以看到胶囊网络在多个问题领域和深度神经网络架构中得到广泛的使用。
    03 深度增强学习：交互型问题解决之道
    简述：深度增强学习是一种通过观察、行动和奖励来与环境互动，从而进行学习的神经网络算法。它已被用于游戏攻略等，如雅达利（Atari）和围棋，包括击败人类冠军的著名的“阿尔法狗”（AlphaGo）等。
    意义：获得深度增强学习能力是人工智能应用商业化的重要指标项之一，与其他技术相比，它只需要更少的数据来培训其模型。更强大的是，它可以通过模拟获得训练，完全不需要标签化数据。鉴于这些优势，预计未来一年将诞生更多将深度增强学习和基于智能体（agent）模拟相结合的商业应用。
    04 生成对抗网络：网络配对促进训练，减轻处理负担
    简述：生成对抗网络是一种由两个互相竞争的神经网络组成的无监督的深度学习系统——“生成网络”产生看上去很像真实数据集的假数据，“判断网络”吸收真实和合成的数据。随着时间的推移，每个网络都会得到改进，从而使两个网络都能够学习到给定数据集的整个分布情况。
    意义：生成对抗网络进一步拓展了深度学习，使其能够处理更大范围的无监督任务，这些任务的标签化数据要么不存在，要么过于昂贵而很难获得。生成对抗网络也减少了深度神经网络所需的负载，因为负载由两个网络共同承担。预期可以看到更多的商业应用，例如使用生成对抗网络技术来做网络探测等。
    05 精简和增强数据学习：解决数据标签化挑战
    简述：机器学习（尤其是深度学习）遇到的最大挑战是需要大量使用标签化数据来训练系统。目前有两种广泛使用的技巧可以帮助解决这个问题：（1）合成新的数据；（2）将一个任务或领域的训练模型迁移到另一个，例如“迁移学习”的技巧（把从一个任务／领域学到的经验迁移到另一个任务／领域），或“一次学习”的技巧（极端化迁移学习，仅仅通过一个例子或没有相关例子的学习），由此使它们成为“精简数据”学习技巧。同样的，通过模拟或内插合成新的数据有助于获取更多的数据，从而扩大现有数据来改善学习。
    意义：使用这些技巧，我们可以解决更多的问题，尤其是在历史数据较少的情况下。预期可以看到精简和增强数据的更多变种，以及适用于更广泛商业问题的不同类型的学习技巧。
    06 概率编程：便于模型开发的语言
    简述：概率编程是一种高级编程语言及建模框架，它能让开发人员便捷地设计概率模型，并且自动求解这些模型。概率编程语言可以让我们重复使用模型库，支持交互式建模以及认证，并提供必要的抽象层来更广泛和有效地推论通用模型组。
    意义：概率编程框架适合的场景包括在商业领域内极为常见的不确定和不完整信息的情况。未来，我们会看到这些语言得到更广泛地应用，并期望它们也用于深度学习。
    07 混合学习模式：结合算法优势解决不确定性问题
    简述：不同类型的深度神经网络，譬如生成对抗网络和深度增强学习，在它们的效果和结合不同类型数据的广泛应用方面显示出巨大的前景。不过，深度学习模型不能为不确定性的数据场景建模，而贝叶斯概率方法却能够做到。混合学习模式结合了这两种方法，且能够充分利用每一种方法的优势。混合模型的一些例子包括贝叶斯深度学习，贝叶斯生成对抗网络和贝叶斯条件生成对抗网络等。
    意义：混合学习模式将商业问题的种类扩大到对不确定性进行深度学习。这可以帮助我们获得更佳效果，提高模型的可解释性，从而鼓励更广泛的应用。我们将看到更多能够媲美贝叶斯法的深度学习方法，以及概率编程语言能够更好地与深度学习相融合。
    08 自动机器学习：无需编程即可创建模型
    简述：开发机器学习模型是一项耗时长且必须由专家驱动的工作，包括数据准备、特征选择、模型或技术选择、训练和调试等。自动机器学习旨在使用多种不同的统计学和深度学习算法来自动化这项工作。
    意义：自动机器学习被视为人工智能工具“民主化”的一个部分，用户可以借助它在没有高级编程技能的情况下开发机器学习模型。这将加快数据科学家创建模型的速度。我们将看到更多的商业化自动机器学习包，以及自动机器学习与更广泛的机器学习平台的整合。
    09 数字孪生体：超越工业应用的虚拟复制品
    简述：数字孪生体是一种虚拟模型，用于物理或心理系统的详细分析和监测。数字孪生体的概念起源于工业界，广泛用于分析和监测诸如风电场或工业系统等。现在，通过使用基于智能体的建模（用于模拟自动智能体的行为和交互的计算模型）和系统动态学（计算机辅助的策略分析和设计方法）等，数字孪生体被广泛应用于非物理对象和流程管控中，例如预测客户行为等。
    意义：数字孪生体可以帮助促进物联网（IoT）的发展和更广泛的应用，为预测性诊断和维护物联网系统提供了一种方法。展望未来，有望在实体系统和消费者选择建模中看到更多数字孪生体的使用。
    10 可解释的人工智能：打开黑匣子
    简述：目前，有许多机器学习算法正在使用中，它们可以在各种不同的应用场合中感知、思考和行动。然而，其中许多算法被认为是“黑匣子”，人们对于它们是如何计算出结果几乎是一无所知。可解释的人工智能意在进一步开发机器学习技巧，在产生更多可解释的模型的同时保持人工智能预测的准确性。
    意义：可解释、可证明且透明的人工智能对建立技术信任至关重要，这会促进更广泛地采用机器学习技巧。我们预测，在开始大规模采用人工智能之前，企业可能会将可解释的人工智能作为一项要求或者最佳实践，与此同时，政府可能会将可解释的人工智能作为未来的一项法规要求。