3D传感器让人脸识别大放异彩 高通:智能手机“黑科技”还有很多
小米、vivo、苹果新机几乎同期扑面而来,让业界嗅到智能手机的一个热点:“人脸识别”——小米Note 3、vivo V7+、iPhone X都支持刷脸解锁,另外一个热点是“全面屏”,然而智能手机蓄势待发的技术何其多:机器智能、千兆级LTE、2X2双通路Wi-Fi、射频前端、快充等等(如下图)让人猝不及防,为了搞清楚这些炫酷的招数,我们采访了高通工程技术副总裁ChienChung (CC) Chang,梳理出智能手机之4件热门技术。
图:高通持续深耕智能手机的技术研发
人脸识别的门槛之一是3D传感器技术
3D传感器技术的重要性在于它可以表现出很多2D无法表达的东西。通俗点说,当人脸识别那几秒,3D能感应到人脸轮廓中凹凸不平的部位,比如眼睛是凹进去的,耳朵是凸出来的,但如果是2D,这些器官都会显示在同一平面中。
人脸识别的第一步,需要3D成像——结构光模组负责采集深度数据、与摄像头接收的2D影像数据整合,从而形成完整的3D影像。这显然要求多个模组(结构光发射端、结构光接收端、前摄像头等)有团队协作精神。
而高通在这一领域耕耘多年,高通第二代Spectra ISP支持人脸识别技术和3D深度感知技术。在3D深度感知方案上,高通采用面向计算机视觉、图像质量和功效提升而设计的全新摄像头架构,以完成密集的深度图生成、图像分割等各种智能视觉应用。
图解高通3D深度传感器,利用红外线接受三维深度数据,形成高分辨率的深度数据,可以准确识别人脸,即使在低光环境下也能进行三维重建
高通与奇景光电同时还在加快推进SLiM(结构光模组)3D解决方案,可以为厂商提供完整的3D摄像头模组和技术。除了手机之外,汽车、无人机、监视器等产品也都会广泛使用这个技术。
有消息称,SLiM的3D摄像头模组方案将会在明年1月份量产,而搭载它的安卓手机也会在明年Q1亮相。
ChienChung (CC) Chang延伸介绍了高通3D深度传感器技术的其他应用(如下图)。第一个应用是将单反相机的景深感测功能迁移到手机上,可以将镜头聚焦某一个人,背景虚化,呈现出一种单反拍人的效果;还有一个应用是VR的感测避障功能,如果戴上VR眼镜的你周遭环境很黑暗,VR眼镜内置的3D传感器可以帮你感测四周障碍物,以免磕伤撞伤。
H.265编码是4K视频的好帮手
通常我们看网络视频,流量会跑得很快,保存视频也会占用大量存储,这是因为视频未被压缩、占用带宽的缘故。ChienChung (CC) Chang告诉我们,假如一段每秒30帧的高清视频未经过压缩,那么每秒约使用10亿比特(带宽单位),而压缩之后,每秒可以降低到2000万比特。结论就是,压缩技术可以将视频的大小缩减到原有版本的1/50。
国际上有许多视频压缩的标准,最新的一项标准是H.265高效率视频编码(High Efficiency Video Coding,简称HEVC),由ITU-T视频编码专家组与ISO/IEC动态图像专家组联合成立的视频编码联合协作组(JCT-VC)在2013年建立,很多公司参与建立了这一标准,高通也参与其中。
图:HEVC驱动多媒体消费革命,有益于OEM厂商、视频供应商、内容创作者
H.265 标准被认为不仅提升视频质量、缩减带宽成本,还能达到上一代 H.264/MPEG-4 AVC 两倍之压缩率——等于同样画质下,比特率减少了50%,存储大小相同的条件下,使用H.264只能录2个小时的视频,H.265则可以录4个小时。H.265 还能支持 4K 甚至超高清电视(UHDTV),最高分辨率可达 8192×4320(8K 分辨率)。
随着手机、电脑、相机、电视的摄像头、视频解析度逐渐往越来越高分辨率发展,H.265编码迎来了风口。“高通是H.265标准的主要支持者和开发者,其中多项技术都是由高通团队负责研发的。”ChienChung (CC) Chang介绍。
高通正致力于推动中国主要的视频供应商和内容制造者使用H.265标准,意味着国内的视频压缩技术水平能再向前迈进一步。而在国外,随着苹果最新一代手机和电视使用H.265标准,包括安卓手机在内的其他手机制造商,以及包括Netflix和YouTube在内的视频内容供应商,都会迅速跟上这股潮流。
1 2 下一页>