不再傻傻分不清你想了解的人工智能这里都有

2024.06.04

    当前，人工智能正在席卷全球科技产业，越来越多的行业和市场都在人工智能领域进行深耕，作为当今辅助人类进行创新和变革的重要生产力工具和技术驱动力，人工智能技术当前已经发展到什么阶段了呢？未来人工智能产业又将会走向何方呢？本期我们一起来聊聊。
    对于人工智能技术来说，我们日常经常看到的或许是机器算法的应用、又或是对于自然语言的处理等内容，对于人工智能来说，现在已经收集了海量的最优算法，其中涵盖了计算机视觉、游戏、自然语言处理、网络图、知识库等很多内容。
    计算机视觉感知
    其中值得一提的是计算机视觉，对于计算机视觉来说，3D技术是最受青睐的一类，2017年的CVPR，MIT、马萨诸塞大学阿默斯特分校和谷歌DeepMind的研究人员展示了一项成果，使用自动编码器（VAE），构建了一个名叫SingleVPNet的框架，能从多个视角的深度图或其相应的轮廓（silhouette）学习生成模型，并使用渲染函数从这些图像生成细节精致的3D形状。
    对于计算机识别感知框架来说，通过一系列不同视角的2D深度图当中，研究人员就能够去生成新的3D形状和3D图片，其中的平均误差将会缩小到0．35左右，也就是说计算机视觉所带来的3D图片将会是非常逼真的一张图。
    动作识别
    在人工智能领域当中，动作识别是整个视频识别当中最为关键的一项组成部分，整个动作可能会贯穿视频当中，对于动作识别来说，很有可能成为图像识别的重要组成部分，2017年的NeurIPS，CMU机器人学院的研究人员Rohit Girdhar 和 Deva Ramanan 利用注意力机制（Attentional Pooling），在保持网络复杂度和计算量基本不变的情况下，在三个静态图像和视频标准动作识别数据集上提升了动作识别的基准。其中，在MPII人体姿态数据集上取得了12．5％的相对改进。
    人脸识别技术
    在今年的市场研究数据报告显示，在被誉为工业界“黄金标准”的全球人脸识别算法测试（FRVT）中，依图科技以千万分之一误报下的识别准确率超过99％，继续保持全球人脸识别竞赛冠军。
    千万分位误报下的识别准确率超过99％，意味着更多核心关键的安防场景被解锁。相比于去年同期，全球人脸识别性能提升了80％。在整个报告当中对于很多国内的人工智能企业进行了重点的提及和展示，而中国的人工智能企业也的确在业务领域和技术创新方面领跑全球。
    人体姿态数据分析
    在今年的9月份，AlphaPose系统升级，采用PyTorch框架，在姿态估计标准测试集COCO validation set上，达到 71mAP的精度比OpenPose 相对提升17％，Mask－RCNN相对提升8％，同时，速度达到了20FPS比OpenPose相对提高66％，Mask－RCNN相对提高300％。
    图像分类
    计算机对于图像处理来说其实早就已经超越了人类的原有技术应用，当前图像分类精度的最好成绩，往往是其他研究的副产物。ICLR 2017，谷歌大脑 Barret Zoph 和 Quoc V． Le 发表了“Neural Architecture Search with Reinforcement Learning”，他们用强化学习自动搜索神经网络结构，最终AI自己设计出的模型，在 CIFAR－10数据集上做图像分类取得了96．35％的精度。
    GAN在今年不断发展，今年ICLR DeepMind 提出的 BigGAN，可谓当前最强图像生成模型，在128x128分辨率的ImageNet上训练，BigGAN的 Inception 分数（IS）可以达到 166．3 ，Frechet Inception 距离（FID）9．6。