为什么这两家娱乐公司都在不务正业搞AI竞赛？

2024.05.15

    十数年时间，中国互联网视频历经风云变幻，总是你方唱罢我才休。
    市场一直在变，而在公众认知范围内，视频行业的竞争点在内容、在流量、在资金。直到近期，爱奇艺AI竞赛“发榜”，市场惊觉在竞争格局越发紧张的现在，在线视频已经在凭技术突围。
    其实在AI领域，竞赛并不鲜见。不过近几年，越来越多的AI竞赛将命题从单纯的物体识别聚焦到了人物甚至人物动态识别上。这使得越来越多流媒体平台现身其中。前有美国Netflix通过AI竞赛，现在爱奇艺也拿出高额奖金旨在进一步拓展在人物识别领域的技术进步，中美的两家娱乐头部公司不约而同地做起了技术方面的竞赛，无疑是娱乐行业中值得关注的全新的风向标。只是，竞赛往往意味着长时间的赛程，多资源的调动，以及不确定的赛果回馈，爱奇艺和Netflix举办AI竞赛，究竟释放了什么样的信号？
    中美纷纷瞄准AI竞赛，究竟想赛出什么
    AI一直是各个巨头抢滩布局的主阵地，在让人眼花缭乱的各式招数之中，“竞赛”成为诸多科技企业的选择。就在上个月，谷歌推出了AI Impact Challenge，这是一项高达2500万美元奖金的优秀作品竞赛，这项竞赛旨在将最佳创意转化为行动，推动行业技术研究和应用，对整个社会产生积极影响。
    再往前推，ICRA在过去几年分别和亚马逊、空客等公司合办过机器人挑战赛。通过机器人挑战赛，亚马逊希望加强工业和学术机器人之间的关系，并促进共享和开放的解决方案，解决亚马逊平台在非结构化自动化领域面临的技术挑战。而空客则希望寻求一个创新的想法和数字解决方案，带来了航空航天行业的技术变革。
    Netflix也在几年前就启动了AI竞赛，公开征集电影推荐系统的电脑算法。赛后，Netflix在比赛结果的基础上，把现有推荐系统的准确率提高了10％。
    AI竞赛不仅让举办公司实现了技术上的突破，还推动了AI技术在行业的落地，不少竞赛更是成为了AI发展史上的里程碑，成为了技术以及相关产业发展的助推器。
    最著名的是ImageNet大规模视觉识别挑战赛（ILSVRC），从2010年以来，ImageNet每年都会举办一次软件竞赛，主要评价算法在大尺度上对物体检测和图像分类的效果。在这几年的比赛中，涌现了大量优胜算法，比如2013年的ZFNet、2014年的VGGNet、GoogLeNet和2015年的ResNet，该竞赛不仅成为了各团队、巨头展示实力的竞技场，还促进了AI领域卷积神经网络的研究和发展。
    目前，大家所熟知的AlexNet便是从这个竞赛中脱颖而出。时隔六年，AlexNet中的一些方法比如数据增强和dropout，直到现在也在使用。而相关的论文《ImageNet Classification with Deep Convolutional Networks》迄今被引用约7000次，被业内普遍视为行业最重要的论文之一。这项技术的提升将对机器翻译、自然语言处理、医学影像分析、在线多人游戏等领域起到极其关键的作用。
    不同于大多数计算机视觉识别领域的竞争集中在人脸识别，此次爱奇艺AI大赛是全球范围内首个“多模态视频人物识别”领域的科研竞赛。基于人脸、声纹、姿态、场景等多模态特征的人物识别技术属于AI领域中前沿的技术。目前在人脸识别领域最热门的评测竞赛包括LFW与MegaFace，前者侧重于对比两张人脸照片是否具有相同身份，后者则是以在海量注册人脸中检索特定人脸的准确率为重要指标。而此次爱奇艺推出“多模态视频人物识别挑战赛”则是侧重基于人物的声音、体态、着装、行为举止等多维度进行综合识别，更接近真实场景的需求，难度更大。在胜出团队的MAP平均精度均值88．65％的基础上，爱奇艺利用头部、声音、人体等多模态特征融合信息和更少的模型，将精准度提高了0．8％，推动了该技术在视频领域的应用。
    多种多样AI竞赛的举办，显示了行业对AI技术的探索热情。AI正在爆发新的产能，不论哪个行业，任何一家公司只有不断创新，才能在AI主战场上抢得阵地；竞赛在最大范围内调动了国内外AI研发团队的参赛积极性，为技术领域提供了选拔创新人才和项目的渠道；资金、商业数据由企业投放给学术界，学术界反哺给企业科研结果和人才，形成产学研的有机孵化生态，利于技术向生产力转化的效率提升。
    用户观看体验需求再升级，娱乐生态行业如何转型破局
    AI技术受到视频平台的追捧与行业面临的变革不无关系。视频行业发展初期，资本的能力和意愿是视频网站最核心的流量入口。对于内容制作商而言，通常是把内容卖给出价最高的，由此，视频平台通过资本驱动，实现了内容从无到有的变化。
    随着用户对内容的要求越来越高，近几年，各大视频平台开始围绕优质内容进行竞争，也是在这个时期，内容成为流量入口，各大视频网站都有了自己制作的内容，包括电视剧、网综、网络大电影等，诞生了诸如《奇葩说》《河神》此类的影视爆款。
    如今，人们对视频形态的要求再一次发生了变化。比如观看视频的时间越来越碎片化，短视频、倍速观看、养肥了再看、跨屏看等等，人们观看视频的自主化和个性化也越来越强。在视频行业转型的关键时期，视频平台凭借AI技术破局，要解决的是C端体验和B端效率的问题。从这方面来看，爱奇艺举办AI竞赛，抢占多模态视频人物识别赛道，也有了更深层次的意义。
    首先，视频人物识别技术的应用能够应对碎片时代内容精准获取的问题。基于智能人物识别的“只看TA”、以图搜剧等功能，用户可更精确地捕捉视频画面，为用户带来更为个性化的观看体验，在大型综艺节目《中国新说唱》的后期制作中，人物识别就实现了精彩画面查找功能，后期制作人员通过特定标签，可以在数秒内调出特定表演者的视频素材。
    其次，人物识别技术能够有效提升平台分发、运营的效率，这也给行业带来了新的创业和创新机遇——基于全网最大的智能明星库，AI能识别出明星、剧情、行为、动作、情感、台词等多种类别海量场景，让广告与内容实现智能匹配，达到广告投放效果和用户体验的双重提升，进而增强平台的货币化能力。爱奇艺的“创可贴”广告就是一种全新的广告形态。
    但是，目前的主流人物识别技术都是针对轻量级人脸图像数据库。在实际应用中，识别效果往往受到多姿态、多表情、多年龄、多光照、多分辨率、不同角色化妆、局部遮挡等影响，还无法达到应用所需的满意精度。
    所以，如果能掌握更多维度的人物识别技术，将更能应对用户体验的升级，并提升平台的运营效率和货币化能力。爱奇艺洞察用户需求，举办AI竞赛，显然是为了形成更好的AI战略布局，打造新的内容形态，进而解决提升用户体验和平台效率。
    迈入技术战场，爱奇艺的挑战与机遇
    长期来看，技术已经成为现在视频行业转型破局的关键。而在这个战场上，爱奇艺虽然先发制人，首先抢占了多模态视频人物识别技术的赛道，但以爱奇艺为首的视频平台们依然面临着挑战。
    虽然视频行业的商业逻辑简单，但AI技术的门槛较高。纵观整个视频生命周期，包含了视频采集、生产制作、播出、用户体验这几个环节，视频平台必须有足够的技术实力和对整体的把控力，才能提升每个环节的效率和质量，进而让AI技术发挥应用和商业价值，带来视频的变革。
    2014年爱奇艺开始布局AI技术，不断提升用户体验，目前爱奇艺已经成为了年轻用户的聚集地。据爱奇艺Q3财报显示，爱奇艺的会员规模已经增长到8070万。而且根据QuestMobile的统计数据，2018年8月，爱奇艺APP月总使用时长59．08亿小时，在线视频领域排名第一，全网排名第三。因此，爱奇艺在大数据的数量和维度上有着行业领先的优势，进而导致用户模型的基础更加夯实。
    其次，爱奇艺已经将AI技术应用于内容创作、生产、标注、分发、播放、货币化与客户服务等环节，实现多线AI技术的转化落地，搭建起以技术为驱动的娱乐生态平台，而多模态视频人物识别技术的突破无疑又为平台增添了一份筹码。同时，这次竞赛也让AI＋视频的话题进一步发酵，获得公众的关注。
    而多模态视频人物识别技术的突破也将进一步优化爱奇艺娱乐生态系统的方方面面：爱创媒资系统、艺汇智能选角系统等已经应用于自制内容的制作，将会进一步优化娱乐生态系统的效率；在智能拆条、智能化广告点位选取，更在保证用户体验的基础上，最大化广告主的收益，进而增强爱奇艺的货币化能力。
    同时，该技术产生的数据也能反哺爱奇艺AI生态系统。爱奇艺创始人、CEO龚宇曾表示，目前爱奇艺引入的人工智能算法已经可以精准预测在本平台播出的电视剧和节目的收视情况，并以此作为制作标准，反过来指导内容选择与策划。同理，将用户使用人物识别功能的数据赋予知识图谱和深度学习技术，能够优化视频推荐模型，研发出更多实用性很强的功能。
    结论
    随着AI技术对视频产业影响的逐渐深入，各大视频平台纷纷布局AI领域，而这显然是一道技术优劣决定胜负的题目。总体来看，爱奇艺的AI基因还是十分强大，对AI应用的创新也使其在在线视频领域拔得头筹。而对于整个行业而言，爱奇艺的AI技术能力能够为市场带来更多可能。而不论技术发展如何，从用户体验出发，总能让公司先行一步。
    文｜颜璇