华为高级研究员谢凌曦: 下一代人工智能计算模型探索

2024.05.04 将门创投

    导读
    为什么、难在哪、怎么做：——下一代人工智能计算模型探索
    Next Generation of AI－Computing Models：——Why， What， and How下一代人工智能计算模型，主要是使用一些自动化技术帮助我们设计更好的深度学习网络结构，并在任务中提升性能。本文会重点从Why、What、How这3个地方重点讲解。
    第一部分什么是网络架构搜索（NAS）？为什么很重要？
    一、AI领域未来面临的挑战
    有3件事是确定的：数据（data），模型（model），知识（knowledge）

    1．数据
    Data－efficiency：如何利用有限或多模态数据训练模型？
    在如今的数据爆炸时代，会产生海量的数据，其中只有很少的数据有数据标注，大量的数据没有数据标注，且数据很“脏”。于是引出了第一个问题：如何从海量数据重，真正学习到自己想要的东西。
    AI未来的发展方向是从全监督发展成自监督和无监督的方向。
    2．模型
    Auto－learning：如何为人工智能应用设计强大高效的模型？
    这一代的计算模型主要是基于深度学习的，尤其是卷积神经网络。深度学习在图像识别领域的应用，使得原先的模型从手工识别特征发展到自动学习特征。
    基于这种发展的趋势，我们将模型继续推进一步，使得深度学习的网络设计也从手动转为自动。这是模型部分所面临的挑战。
    3．知识
    Knowledge－aware：如何定义和存储知识，使训练后的模型安全可靠？
    现有模型的算法，大部分都是拟合和训练数据，并不能保证拟合得到的结果具备分析常识的能力，即“不能真正地学习知识”。由于计算机缺乏常识，对知识的学习，可能会成为AI未来5年的研究方向。
    二、AutoML介绍
    本文的重点是模型部分，主要分析手动和自动，这两种思路的区别。
    2017年自动化网格搜索架构被提出后，“手动更好”还是“自动更好”这类争论不断。在争论的过程中逐渐催生出了一个新的方向，称为自动化机器学习（AutoML）。这一方向在工业界得到了更多的关注度。
    工业界的关注度超过学术结，主要有两个原因：
    （1）工业界的算力更强。
    AutoML算法对计算资源的消耗非常大。例如，Google发表的NAS方面的论文，需要上万个GPU ／天才能完成这样的计算。
    （2）工业界有很强的需求。AutoML可以帮工业界节省很多的开发成本。
    以华为为例，华为有各种各样不同的手机产品，从旗舰机到低端的手机，芯片的计算能力会差很多。用户会需要在不同的手机中完成相似的功能（如拍视频），因此针对不同的芯片需要设计不同的网络架构以满足用户的需求；另一方面，用户的需求（如清晰度的要求）是实时变化的，如果使用人工机器学习算法，会带来巨大的人力投入。基于此，工业界存在自动化算法的需求。