融合八大黑科技 华为CloudLink开启企业通信新时代

常言道

    从早期的电话会议到后来的视频会议,企业通信方式的变迁已经从声音走向视频;但现在的问题是,在视频会议的基础上,企业通信又将如何进化呢?
    正如“更快、更高、更强”的奥林匹克运动口号一样,新技术的发展和进化同样没有止境。在企业通信不断发展的过程中,所有参与其中的科技企业也在努力融入更多的先进技术,为客户带来更加优质的体验。
    如今,融合了八大“黑科技”的全新华为CloudLink协作智真系列产品的发布,已经不再属于传统视频会议的范畴,而是将企业通信带入到一个新的时代。而从这些“黑科技”给企业通信所产生的优化和提升来看,企业通信新时代将具备三个鲜明的特点:协作、智、真。
    具体来说,“协作”指的是将会议与协作已经融为一体,让企业的交流更加高效、自由;“智”则是将企业通信与人工智能充分融合到一起;“真”代表的是从高清到极清,这种清晰度上的提升同时也让企业通信的应用场景更加广泛。
    
    12月20日,在主题为“联接时空 改变未来”的2018华为CloudLink新品品鉴暨伙伴招募大会·合肥站上,华为CloudLink协作智真系列产品所展现出的八大“黑科技”,充分体现了企业通信新时代“协作、智、真”三大特点,受到与会嘉宾的高度关注。
    “协作”不再有障碍
    如今,企业不同部门、不同区域之间的密切沟通,使得企业通信产品已经成为重要的生产力工具,并在高效的沟通和协作中发挥着举足轻重的作用。传统的企业通信产品,主要就是一套具备音视频通信能力的硬件设备,由于硬件设备、网络等方面的不足,企业通信产品的音频和视频质量远远无法满足复杂环境下的企业协作需求。
    如果企业通信产品能够在网络稳定性、声音采集等方面有所增强,势必会大大拓宽其应用范围和领域,进而获得更大的发展空间。因此,华为全新发布的CloudLink协作智真系列产品在音视频纠错、声音识别、降噪等方面进行了全面增强,以提升企业协作的质量。
    黑科技一:超强纠错技术SEC3.0。CloudLink支持音视频超强纠错技术,具备超强的网络适应性。其中,在视频方面,综合运用ARS网络模型检测、HARQ超强丢包重传、SEC3.0前向冗余算法、AJB技术和适应秒级网络延迟及抖动等技术,可以实现视频抗丢包率达到30%;而在音频方面,则采用可变码率编码、NetATE网络适应性技术、前端FEC及RED抗丢包算法和后端PLC处理,可实现音频抗丢包率达到70%。
    
    黑科技二:前向智能波束拾音+后向“音幕”。CloudLink采用智能波束拾音技术+后向专用MIC滤噪技术。其中,正面利用12个全向MIC,使用Beamforming技术,形成多个拾音波束。通过这些波束,可以提升远距离拾音效果、增强去混响能力,并对会议音频进行增强处理。借助高性能定位算法,定位精度达到0.5度,即6米距离可定位出水平相差5cm的两位发言人。同时,在背部部署的后向降噪MIC,负责采集后向声音,进而将其全部过滤,形成可屏蔽后向干扰声音的“音幕”。
    
    从这两大黑科技可以看出,超强纠错技术解决的是网络不稳定所造成的音视频传输质量问题,而智能波束拾音+后向“音幕”解决的则是声音的识别和降噪等问题,这对于提升视频会议的沟通协作体验无疑有着重要意义。
    “智”能体验前所未有
    如果非要选出一个近两年给人们工作和生活影响最大的技术,人工智能可谓当仁不让;企业通信产品发展到今天,它与人工智能技术的融合也变得顺理成章。其中,有许多传统视频会议系统无法解决的痛点,在人工智能技术的帮助下更是迎刃而解。
    比如,传统视频会议通常采用复杂键控方式,系统的使用难度较高;但人工智能技术的运用,使得会议系统通过语音智能,就能够完成会议的发起和结束,实现会议成员添加、画面切换、音量调节等,大大简化了会议操作复杂度。
    此外,在传统视频会议系统中,参会人员在会前往往需要进行自我介绍,而融入人工智能技术的视频会议系统可以自动识别参会人,并给出铭牌显示,从而提升沟通效率;不仅如此,传统视频会议中对于发言人的跟踪也主要靠系统控制人员完成,画面切换速度和效果都存在一定不足,而运用人工智能技术的会议导播,可以实现对发言人的精准定位和自动跟踪。如今,这些智能体验都已经融入到了华为CloudLink协作智真系列产品中。
    黑科技三:智能语音会控。CloudLink内嵌智能助理“小微”,通过综合运用语音助手、语音唤醒、远场拾音、语音识别(ASR)、自然语言处理(NLP)、语音合成(TTS)等多项关键技术,可以实现高准确率语音会控。而为了让“小微”听得清语音、听得懂指令,华为CloudLink对不同回声和双讲等场景进行调优,并采用业界最高语言识别能力的神经网络算法,对常用指令进行几十万种说法训练。
    黑科技四:基于人脸识别的电子铭牌。CloudLink支持基于人脸识别的电子铭牌。运用动态场景分析算法和业界最高水准的人脸识别算法,基于内置AI处理器强大的处理能力,完成人脸检测,人脸跟踪及人脸识别,提供实时电子铭牌体验,最远识别距离更是超过12米。
    
    黑科技五:智能导播。CloudLink支持基于声音+图像双重定位的智能导播,首先采用声源定位算法,准确判断声音方向;然后通过人脸检测和三维定位算法,精准判断发言人位置,可准确区分肩并肩的不同发言人;自动估算发言人距离,智能调整PTZ(pan/tilt/zoom)变焦倍数,输出发言人最优画面;智能区分单人/双人交替/无人等不同发言场景,在个人特写,双人对话,全景画面之间进行流畅切换,呈现最优的会议体验。

    “真”正身临其境
    在企业通信产品持续演进的过程中,人们对更高视频体验的追求从未停止过,从标清到高清,再到4K极清,甚至4K30极清流畅视频体验。不过越高的视频体验对网络带宽的要求也就越高,如何在低带宽的条件下实现获得4K30极清流畅视频效果,一直是行业公认的难题。
    对视频进行高度压缩来缓解其对网络带宽的压力似乎是一个不错的选择,不过高度压缩的图像还原后,难免存在一些失真,尤其在人眼感敏感的边缘区域、色彩丰富性、光线阴暗区域等方面,通过视频编解码技术的运用,对图像进行还原和优化就显得至关重要。
    
    或许有人会问,高清视频在企业通信中的意义真的有那么大吗?值得我们在这一方面投入如此大的精力。答案当然是肯定的,因为在医疗、精密设计等高端设计行业,需要更高分辨率摄像设备、更好感光元器件,才能确保图像采集足够清晰、细节足够丰富,环境适应性足够强,从而为行业应用提供更清晰的图像呈现。在高清视频保“真”上,华为CloudLink又是如何做到的呢?这就需要从以下几个黑科技说起。
    黑科技六:H.265编解码+活动图像增强VME(Video Motion Enhance) “双核”处理技术。CloudLink通过H.265编解码+VME技术的综合运用,实现了2Mbps带宽下4K30极清流畅视频效果。其中,CloudLink内置强大的硬编解码器通过一系列复杂技术和算法的结合,实现了最高双路4K30的极清视频;运用基于运动检测的智能时域、空域视频滤波降噪算法,使图像还原PSNR提升7.18%;运用ROI技术,智能区分人眼感兴趣的人脸、皮肤等区域,以及不感兴趣的背景、大幅纹理等区域,将有限带宽应用到人眼感兴趣部分;通过后图像处理增强技术,可根据每帧图像特征自动分析出每个像素的滤波强度,消除块状效应,保留更多的图像细节。
    黑科技七:核心ISP图像处理算法。CloudLink采用核心ISP图像处理算法,将图像边缘清晰度提升了20%,颜色准确性提升了100%。其中,运用自适应清晰度增强技术ADE,准确还原真实世界每个点的灰度,提升图像边缘清晰度;精确色彩还原技术(ACR)可智能拓展颜色空间,让画面色彩更丰富;基于人眼图像宽动态WDR技术,可支持感光器件像素级亮度控制,让图像亮度还原更真实。
    
    黑科技八:5K极清摄像。CloudLink Board产品采用集成了5K分辨率摄像头,1英寸光照面、2.4um感光单元CMOS等核心元件的极清摄像方案,让单位像素进光更充分,画面噪点更少,使基础图像更清晰更细腻,结合华为针对自研ISP算法及专有ISP处理硬件,画面效果震撼。同时,5K分辨率原始图像,在进行特写和跟踪时,能达到3倍无损变焦,特写时也不降低画质。
    在企业数字化转型进入全面深化阶段的今天,企业正进入全新的协作时代;企业通信产品也正在从企业开展远程协作的工具转型成为企业的生产力工具,甚至为企业带来全新的商业模式变革。从这个意义上看,融合了八大黑科技的华为CloudLink,不仅仅开启了企业通信的新时代,同样也为企业协作沟通方式带来了全新变革。