让AI触手可及 旷视5款AI技术亮相“Qualcomm人工智能开放日”


    4月19日,Qualcomm以“让AI触手可及”为主题,在深圳举办一年一度的“Qualcomm人工智能开放日”,分享了自身在AI领域10余年的基础科技研发成果,以及推动AI在不同行业落地和普及的最新进展。
    作为Qualcomm AI生态系统的重要合作伙伴,旷视受邀出席本次“Qualcomm人工智能开放日”,并借此机会展示了5款基于Qualcomm人工智能引擎的AI技术,分别是超画质(Super IQ)、希区柯克变焦、AI实时视频虚化、基于ToF技术的人脸识别和支付、3D实时人体姿态追踪。这些AI技术,一方面为人们带来更高效、更智能且具备感知能力的极致体验,另一方面,也表明旷视正在通过AI算法赋能以手机为核心的个人设备大脑场景,来构建驱动百亿台智能设备的物联网生态系统,并走出坚实的一步。
    计算机视觉应用的好坏 
    已成为手机评价标准的重要指标
    从2017年开始,越来越多的手机厂商意识到,人工智能技术给智能手机行业带来新的价值,于是纷纷开始推出“AI+手机”。2018年,主流手机厂商更是在各自的旗舰机型中全面引入AI技术,芯片厂商也纷纷提升产品AI处理的性能,这些都正在成为市场的主流。
    Qualcomm是AI技术和芯片解决方案的佼佼者和领航者。目前,Qualcomm支持完整的从云到端的AI解决方案。在终端侧,骁龙移动平台已为超过10亿部智能手机提供领先的AI加速。以Qualcomm于去年年底推出骁龙855移动平台为例,它集成第四代多核Qualcomm 人工智能引擎,其中包括全新设计的、专门面向AI处理而设计的硬件核心——Hexagon张量加速器(HTA)。
    就在本月,Qualcomm又宣布了面向高端和中端市场的全新骁龙7系和6系全新平台。骁龙730和730G移动平台集成了多项过去仅在骁龙8系支持的技术,实现了全新体验升级,这其中就包括第四代多核人工智能引擎,它提升了拍摄、游戏、语音和安全的终端侧直观交互的处理速度,AI算力是前代平台骁龙710的2倍。
    
    Qualcomm骁龙665、骁龙730和730G移动平台
    得益于AI芯片技术的不断发展,计算机视觉也已成为手机终端不可或缺的技术。视觉技术应用的好坏,已经成为评判一款手机产品重要的指标之一。在2017年《IDC Consumerscape 360°》调研中,51%的用户会将拍照作为购买手机的七大选择因素之一,这也表明视觉应用正在成为提升用户体验,影响用户购买行为的重要指标。
    业内人士分析认为,在当前深入推进的数字化建设进程中,AI 与 IoT 的结合成为行业升级新的探索方向。而在 AIoT 下的万物互联世界,打造应用于不同场景的智能物联终端,也成为实现数字化的首举。作为中国领先的人工智能企业,旷视致力于围绕核心的人工智能框架与深度学习算法连接更多 IoT 设备,与行业生态合作伙伴一起打造软硬结合的数字化产品及解决方案,为客户提供闭环的商业价值,成为行业智能物联方案专家。在这过程中,以手机为核心的个人设备大脑场景来构建驱动百亿台智能设备的物联网生态系统,则成为至关重要的一步。
    旷视作为作为Qualcomm AI生态系统的重要合作伙伴,现也正在将自身成熟的数字化解决方案结合Qualcomm人工智能引擎和移动平台,推动数字化时代下的智能物联终端创新。
    旷视超画质、希区柯克变焦、AI实时视频虚化 
    成为“Qualcomm人工智能开放日”的焦点
    此次在“Qualcomm人工智能开放日”上亮相的旷视超画质(Super IQ)、希区柯克变焦(DollyZoom)、AI实时视频虚化等技术,也从侧面印证着上述观点,成为当天开放日的焦点,引发不少观众关注。
    业内人士认为,人工智能对于智能手机的价值,是能够提前预测用户需求,主动给出相应指引或回应,实现从Smart到Intelligent。未来手机将成为用户联网和交互的中心,并演变为个人设备大脑。因而用户对智能手机的选择,也正在从过去的配置优先逐步向体验优先转变。在改善用户体验中,人工智能及算法将发挥重要作用。
    具体来看,旷视超画质技术基于Qualcomm最新一代旗舰骁龙855移动平台,通过对原始图像进行处理,能够更好地降低图片噪点、保留画面细节,优化拍摄和影像处理的时间,显著提升用户在夜晚和低光照环境下的拍摄体验,突破手机在夜景和弱光环境下拍摄的局限,引领AI+手机夜景拍摄的新潮流。
    
    用户在“Qualcomm人工智能开放日”上体验旷视超画质技术
    利用复合多帧降噪和HDR技术,旷视超画质技术能够提升动态范围,有效提高手机夜间拍照的成功几率,并让相机具备优秀的抗鬼影能力。该技术还能够把整个拍照曝光时间控制在300毫秒左右,算法处理时间则控制在1秒左右,让用户能几乎在按下快门的同时,看到自己所拍摄的超美夜景照,实现所见即所得。同时,通过不同的曝光策略和曝光组合,旷视超画质技术能够有效提升动态范围,取得较好的高光压制效果。
    此次全新亮相的希区柯克变焦,原本是一种专业的电影制作技术。这种效果是通过变焦镜头来调整视角,同时相机朝着或远离拍摄对象推拉(移动),从而使拍摄对象在整个帧中保持相同的大小。在它的经典形式中,当镜头放大时,相机角度会从一个物件上拉开,反之亦然。因此,在缩放过程中,会有一个连续的透视失真,最明显的特征是背景看起来会相对于主题改变大小,营造出一种科幻、炫酷的镜头感。
    通过人工智能人脸检测、特征检测、视频稳定等技术的结合,基于骁龙855移动平台的强大性能和算力,旷视首次创新性的在手机上实现了这一功能,通过智能一键单击,能够产生在滑轨上推动摄像机的大片式拍摄效果,使人像的大小和位置保持不变,同时背景不断变化。在当前短视频内容为王的时代,旷视希区柯克变焦可以让用户轻松炫酷的短视频作品,刷爆朋友圈。
    AI实时视频虚化技术,也是旷视首次基于骁龙855移动平台,在手机上利用AI算法模拟的深度图像来模拟光学失焦的算法。该技术分别使用VideoBokeh(视频虚化算法)与Segmentation(人像分割算法)算法,利用单摄输入,结合虚化算法,配合对RGB图像的理解,使用深度学习算法,可以准确地将前后景物进行区别,从而模拟出光学虚焦的现象。
    旷视3D实时人体姿态追踪算法
    将成为下一代AI+手机发展方向
    3D视觉逐渐成为计算机视觉领域的另一大发展趋势,并确立起核心应用的地位。
    从2018年开始,3D摄像头被越来越多的主流手机厂商所采用,由硬件结合人工智能算法的软硬件结合已成为必然趋势,新的3D视觉时代已经开启。随着光学器件的不断进步,算法与解决方案层不断优化,3D深度视觉的精度和实用性也因此得到大幅提升。在此背景下,3D应用也将为用户带来颠覆性的人机交互体验。旷视基于ToF技术的人脸识别和支付和3D实时人体姿态追踪算法,则是其中的佼佼者和典型代表。
    先看基于ToF技术的人脸识别与支付算法。据旷视相关工作人员介绍,基于该算法,旷视联合 vivo 打造了世界首款基于ToF前置的FaceID。在 3D 支付产品的开发中,vivo 手机基于骁龙845移动平台,在旷视三个核心算法模型结构加持下,可实现 0.1秒内极速识别,0.03秒重建和达百万分之一的支付精度,包括多尺度多特征的注意力检测模型,可自适应网络、多模型融合的识别方案,以及基于业界开创性的移动卷积神经网络 ShuffleNet 定制开发的活体检测模型。有了这项技术,vivo 用户将可以用人脸替代指纹、密码或 PIN 码作为移动支付的主要验证方式。目前,基于ToF技术的人脸识别与支付算法,也已成为更多高端AI+手机的必然选择。
    3D实时人体姿态追踪算法则代表了下一代AI+手机的发展方向。该算法多用于体感游戏、3D试衣等对三维空间动作要求高的场景,难点在于3D骨骼点比2D骨骼点多一个深度维度的信息。旷视相关负责人表示,3D实时人体姿态追踪算法基于骁龙730移动平台结合旷视深度算法一起来实现,并且对摄像头的硬件要求较低,普通2D摄像头即可,可以在手机上达到30FPS的图像,并完全同步模特的动作,在未来拥有巨大的想象和应用空间。
    
    旷视3D实时人体姿态追踪算法在“Qualcomm人工智能开放日”上亮相
    本次旷视在“Qualcomm人工智能开放日”上展示的AI技术,只是旷视众多产品和技术中的冰山一角。
    当前,旷视正在积极推进人工智能及物联网技术与实体经济的加速融合,实现前沿科技规模化的商业落地。在这过程中,以手机为核心的个人设备大脑场景则是其中的重点,旷视以此为支撑,通过算法为移动终端赋能,并持续聚焦客户价值与产品价值。在垂直行业,旷视希望牵头与众多生态合作伙伴一起,打造真正降本增效、软硬结合的行业数字化解决方案,实现客户价值;同时旷视专注自身核心技术基因,不断创新突破,打造极具竞争力的底层核心技术与核心产品,实现产品价值。截止目前,在个人设备大脑场景,旷视的智能终端解决方案已覆盖70%以上的安卓手机市场,旷视开发的刷脸解锁、刷脸支付、3D建模、AI人像光效、超画质等创新应用和方案,正在让 3 亿多台手机变得更聪明。