「听语者」实测:“少数人的需求也应该特别珍视”

VR陀螺

    文/VR陀螺 德林
    时间拨回到三个月前,亮亮视野发布了首款AR字幕眼镜「听语者」,该产品在开售的第一时间就售空,导致官方临时加量500台,并且当晚亮亮视野官网也因用户大量涌入而崩溃了一段时间。
    如此火热的预售情况也让陀螺君很好奇「听语者」究竟有何过人之处?实际的测试又如何呢?
    外观轻巧便携,亮亮视野「听语者」切入细分领域
    “为沟通而生”,这句官方宣传语很准确地概括了「听语者」的定位及功能。
    首先,帮助听力受损人群解决沟通问题是这款设备存在的意义。而沟通,是一项与外界时刻产生联系的活动,因此这类设备都需要考虑一个基础问题——重量、佩戴舒适度以及续航能力。
    
    「听语者」规格参数(图源:亮亮视野)
    打开包装盒可以看到「听语者」的整个产品配件包括便携眼镜盒、磁吸墨镜片、屈光镜框、调节垫片、充电线和眼镜布。
    
    图源:VR陀螺
    「听语者」是一款无线一体的AR眼镜,因其内部集成了两个光机模组、处理芯片、传感器、麦克风、电池等器件,眼镜的外框整体比普通眼镜要显得笨重一些,但与当前的一众双目AR眼镜相比,其外型仍属于出彩的那种,再考虑到是无线产品,加分不少。在讲究AR眼镜“轻量化”的当前,「听语者」裸机79克的重量接近了目前真正拥有AR功能的眼镜的重量极限,是当前最轻的无线双目光波导一体AR眼镜之一。
    此外,在可替换垫片和可调节鼻托的压力分散下以及轻量材料ULTEM 树脂材质(该材质比碳纤维还要轻)的使用下,「听语者」在实际佩戴的使用过程中对鼻子和眼眶不会造成太大的负担。考虑到近视或远视人群屈光度各不相同的情况,用户可以通过「听语者」包装盒内的标准镜框配件自行配备。
    
    「听语者」实物(图源:VR陀螺)
    在舒适度方面,「听语者」还采用了石墨烯散热与气凝胶隔热混合技术让「听语者」既可以有效散热,又可以阻隔热量向人脸的传递。在实际佩戴的过程中,设备发热的情况主要集中在右侧镜腿处,但在佩戴时,感受到的温度不太明显,而一旦拿下设备能感受到发热情况。
    在续航能力上,「听语者」也能满足日常的使用强度。在满电状态下,「听语者」拥有5天超长待机的续航能力,2小时的全功能支持,并且可以随充随用,能做到“充电三十分钟,续航80%”的强续航能力。
    轻巧、耐用是作为一款日常工具的必需要素,在这两个问题上「听语者」都交出了不错的答卷,这是「听语者」走向C端消费者的基础原因,但其核心功能才是消费者愿意买单的关键。
    “看见声音”,「听语者」产品实测
    不论是从产品配置还是外观和综合体验,整款产品给陀螺君最大的感受便是功能性明确,「听语者」填补了行业中缺少的核心垂直场景——听障人士辅助工具的空白。
    在开始使用前,「听语者」需要与官方App“可译”配对使用,在“可译”中,可以完成一系列基础设定,例如字体大小(共有三种大小选择)、背景色、语言选择(目前仅支持中英)、亮度调节、无线网络设定等,在主页面也能看到电量状态、设备状态等信息。
    
    “可译”主页面(图源:VR陀螺)
    将声音信息转化成视觉信息是AR字幕眼镜的核心功能。为了满足全天候都可以佩戴,「听语者」采用的是亮亮视野自主研发的双目光波导技术,拥有85%高透光率、0漏光、1500nits高入眼亮度以及高精度双目融合等特性,在面对强烈的灯光或日光时也能够清晰显示,确保用户的安全性。
    此外,为了更好地在室外强光下显示,「听语者」附带了一个黑色磁吸式的挡片,可以遮挡强光的同时轻松完成时尚点。考虑到室外联网情况的不确定性,「听语者」还支持离线识别,让「听语者」真正走进日常生活,但这个离线识别的稳定性还有待加强。
    
    图源:VR陀螺
    长按电源键开机之后,就可以直接进入使用页面。不过设备的反应速度相对而言较慢,陀螺君测试了一下,至少需要等待超过30秒才显示功能界面,建议在开机页面的动画效果时长上可以缩减。
    进入到字幕转写功能可以通过两种方式,一是在App中选择“开始对话”,二是通过短按右镜腿上的“功能键”实现。进入该功能之后,眼前便是一块AR字幕墙,与他人交流的对话内容会在这里呈现,在“可译”中也可以随时查看使用时的对话记录。
    
    图源:VR陀螺
    据了解,「听语者」的AI语音转写算法可以保证其转换速度在500毫秒以下。测试下来,基本上可以做到对方“话音未落”内容便呈现在了AR字幕墙上。在转写速度上,「听语者」的确做到沟通工具的要义,确保信息快速传递。
    保证快速的同时准确率也不容忽视,而准确率是由信息的“接收”与“输出”两方面同时保障的。在接收时,「听语者」拥有神经网络主动降噪算法,可以根据噪声级别,自动调整增益和麦克风方向性,最大程度确保对方声音的保真度。在输出时,在智能矫正算法加持下,识别的过程中会自动进行断句、语气词、不通顺、错别字矫正的调整。
    双管齐下在实测的过程中效果十分明显,对于平时常用的沟通语句或是手机播放的音频信息,准确度都挺高。不过在十分嘈杂的环境中,还是会被其他声音打断转写的过程,容易把需要的信息“刷”掉,并且一些带有口音、吞音或连读的说话方式会使得校正的准确率相对偏低。
    
    「听语者」转写过程(图源:VR陀螺)
    除了固定功能之外,「听语者」在人性化功能设计上也有所考量。例如听障者去看病、银行办理业务时可能无法听到叫号设备正在通知的号码,「听语者」增加了关键词唤醒功能,识别到关键词时该词语页面会闪烁提醒。这一设定对于听障人士而言无疑是一道安全保障,可以对生活工作中的很多情况作出快速的反应。
    而最令陀螺君惊喜的不仅是功能性强,在佩戴过程中视线的处理也十分自然,从外部也无法观测到显示内容,并且还能清晰地看到使用者的眼睛。不仅能保护隐私,在很大程度上将眼镜的“工具化”隐藏,在日常使用中更加方便自然。
    
    图源:VR陀螺
    与娱乐性AR消费端产品一对比,很显然「听语者」的受众相对受到限制,在功能性上也比较单一,但这正是这款产品诞生的初衷——将听障人群的需求摆在首位,解决他们的痛点。
    “少数人的需求,也应该特别珍视。”
    “我可以毫不犹豫地说这个眼镜能解决我们日常生活中90%的尴尬。”一位听力受损的摄影师夏东说道。在过去的日子里,他曾尝试过助听器、手机App、打字、写字等多种方式与外界沟通,“只要是能够帮助我获取信息的工具,让我不对别人的表达过度猜想,帮助我减少部分脑力的消耗,那就是我的需求。”
    这也是绝大部分听障人士的需求。根据《无障碍产业报告——无障碍沟通》,目前在我国听力障碍人数超过7000万,是国内数量最大的残障群体。根据Global Information的全球听力设备市场报告,全球听力设备的市场规模在2030年前将达到160.9亿美元。
    根据深圳市信息无障碍研究会《2022年中国听障用户数字产品体验调研报告》,调研发现语音转文字、声音识别、文字转语音、对话增强和手语服务功能是听障用户认为较为重要的功能,其中,对于极重度损伤用户而言,语音转文字和文字转语音更看重。
    
    图源:深圳市信息无障碍研究会
    同时该报告也指出,大众对听障群体的常见误区,其中包括听得见不等于听得清、听得见也不等于听得懂,受访用户反馈信息获取和理解比较困难是工作中遇到最多的问题,信息的转化是听障辅助设备需要重点优化的关键。
    即便有近7成用户会佩戴助听设备,但助听器这类产品存在的缺点也很多,例如耳朵负担大、导线易损坏、价格偏高、噪声大等,这个市场仍需要更多样的产品供用户群体选择。
    随着科技的发展,市面上的听障辅助设备也在更新迭代,更加多样化,如何突破现状,让听障群体“看见声音”、减少信息差是亮亮视野在听障辅助设备上看到的市场空白——AR字幕眼镜。
    
    图源:网络
    与VR硬件市场相比,AR硬件市场有着很大的不同。在技术的成熟度上,AR远不如VR的发展,无论是在光学方案、产品成本控制、量产工艺等方面存在的待解决难度更多,并且目前AR硬件没有一款在市场上得到认可的、可通用的标准产品出现。在这种情况下,不同的产品方案取舍的差别就导致在对AR硬件的探索上,呈现出了两种方式:大而全还是做细分。大而全想要面面俱到,但现有的技术显然无法使其全面兼顾。而细分市场,反而让AR产品定位更明确,从而让产品形态、内容、交互都围绕该场景优化,从而针对特定的需求提升体验。
    2012年Google眼镜横空出世再黯然收场,技术型思维拿锤子找钉子的方式在AR硬件市场上寻找买单的消费人群以失败告终。由于各项技术的互相制约,一款理想化的消费级产品难以实现,在重量、续航、发热、清晰度、大视角、算力等方面存在的代偿情况使得AR硬件更需要从基于现有场景,提升体验的逻辑打开消费级市场,在减法中逐渐加码。
    就像夏东所言,虽然「听语者」并不是一款完美的产品,仍然存在进步空间,但在日常生活中,这款产品已经给他带来的便利远超过了那些小缺点。“戴上它,我就能够准确得知别人想传达的信息,不用靠猜,也不用再过度解读别人的一个动作或是一句‘模糊不清’的话了。”
    单一的功能场景对于非核心需求的消费者或许显得无聊,但发布会后即售罄也证明着「听语者」是一款真正为听障群体带来福音的产品,用户的拥护与认可正是「听语者」将功能性发挥出作用的有力证明。陀螺君相信在未来的持续优化中,「听语者」将惠及更多的听障人士。