「听语者」实测：“少数人的需求也应该特别珍视”

2024.03.26 VR陀螺

    文／VR陀螺德林
    时间拨回到三个月前，亮亮视野发布了首款AR字幕眼镜「听语者」，该产品在开售的第一时间就售空，导致官方临时加量500台，并且当晚亮亮视野官网也因用户大量涌入而崩溃了一段时间。
    如此火热的预售情况也让陀螺君很好奇「听语者」究竟有何过人之处？实际的测试又如何呢？
    外观轻巧便携，亮亮视野「听语者」切入细分领域
    “为沟通而生”，这句官方宣传语很准确地概括了「听语者」的定位及功能。
    首先，帮助听力受损人群解决沟通问题是这款设备存在的意义。而沟通，是一项与外界时刻产生联系的活动，因此这类设备都需要考虑一个基础问题——重量、佩戴舒适度以及续航能力。

    「听语者」规格参数（图源：亮亮视野）
    打开包装盒可以看到「听语者」的整个产品配件包括便携眼镜盒、磁吸墨镜片、屈光镜框、调节垫片、充电线和眼镜布。

    图源：VR陀螺
    「听语者」是一款无线一体的AR眼镜，因其内部集成了两个光机模组、处理芯片、传感器、麦克风、电池等器件，眼镜的外框整体比普通眼镜要显得笨重一些，但与当前的一众双目AR眼镜相比，其外型仍属于出彩的那种，再考虑到是无线产品，加分不少。在讲究AR眼镜“轻量化”的当前，「听语者」裸机79克的重量接近了目前真正拥有AR功能的眼镜的重量极限，是当前最轻的无线双目光波导一体AR眼镜之一。
    此外，在可替换垫片和可调节鼻托的压力分散下以及轻量材料ULTEM 树脂材质（该材质比碳纤维还要轻）的使用下，「听语者」在实际佩戴的使用过程中对鼻子和眼眶不会造成太大的负担。考虑到近视或远视人群屈光度各不相同的情况，用户可以通过「听语者」包装盒内的标准镜框配件自行配备。

    「听语者」实物（图源：VR陀螺）
    在舒适度方面，「听语者」还采用了石墨烯散热与气凝胶隔热混合技术让「听语者」既可以有效散热，又可以阻隔热量向人脸的传递。在实际佩戴的过程中，设备发热的情况主要集中在右侧镜腿处，但在佩戴时，感受到的温度不太明显，而一旦拿下设备能感受到发热情况。
    在续航能力上，「听语者」也能满足日常的使用强度。在满电状态下，「听语者」拥有5天超长待机的续航能力，2小时的全功能支持，并且可以随充随用，能做到“充电三十分钟，续航80％”的强续航能力。
    轻巧、耐用是作为一款日常工具的必需要素，在这两个问题上「听语者」都交出了不错的答卷，这是「听语者」走向C端消费者的基础原因，但其核心功能才是消费者愿意买单的关键。
    “看见声音”，「听语者」产品实测
    不论是从产品配置还是外观和综合体验，整款产品给陀螺君最大的感受便是功能性明确，「听语者」填补了行业中缺少的核心垂直场景——听障人士辅助工具的空白。
    在开始使用前，「听语者」需要与官方App“可译”配对使用，在“可译”中，可以完成一系列基础设定，例如字体大小（共有三种大小选择）、背景色、语言选择（目前仅支持中英）、亮度调节、无线网络设定等，在主页面也能看到电量状态、设备状态等信息。

    “可译”主页面（图源：VR陀螺）
    将声音信息转化成视觉信息是AR字幕眼镜的核心功能。为了满足全天候都可以佩戴，「听语者」采用的是亮亮视野自主研发的双目光波导技术，拥有85％高透光率、0漏光、1500nits高入眼亮度以及高精度双目融合等特性，在面对强烈的灯光或日光时也能够清晰显示，确保用户的安全性。
    此外，为了更好地在室外强光下显示，「听语者」附带了一个黑色磁吸式的挡片，可以遮挡强光的同时轻松完成时尚点。考虑到室外联网情况的不确定性，「听语者」还支持离线识别，让「听语者」真正走进日常生活，但这个离线识别的稳定性还有待加强。

    图源：VR陀螺
    长按电源键开机之后，就可以直接进入使用页面。不过设备的反应速度相对而言较慢，陀螺君测试了一下，至少需要等待超过30秒才显示功能界面，建议在开机页面的动画效果时长上可以缩减。
    进入到字幕转写功能可以通过两种方式，一是在App中选择“开始对话”，二是通过短按右镜腿上的“功能键”实现。进入该功能之后，眼前便是一块AR字幕墙，与他人交流的对话内容会在这里呈现，在“可译”中也可以随时查看使用时的对话记录。

    图源：VR陀螺
    据了解，「听语者」的AI语音转写算法可以保证其转换速度在500毫秒以下。测试下来，基本上可以做到对方“话音未落”内容便呈现在了AR字幕墙上。在转写速度上，「听语者」的确做到沟通工具的要义，确保信息快速传递。
    保证快速的同时准确率也不容忽视，而准确率是由信息的“接收”与“输出”两方面同时保障的。在接收时，「听语者」拥有神经网络主动降噪算法，可以根据噪声级别，自动调整增益和麦克风方向性，最大程度确保对方声音的保真度。在输出时，在智能矫正算法加持下，识别的过程中会自动进行断句、语气词、不通顺、错别字矫正的调整。
    双管齐下在实测的过程中效果十分明显，对于平时常用的沟通语句或是手机播放的音频信息，准确度都挺高。不过在十分嘈杂的环境中，还是会被其他声音打断转写的过程，容易把需要的信息“刷”掉，并且一些带有口音、吞音或连读的说话方式会使得校正的准确率相对偏低。

    「听语者」转写过程（图源：VR陀螺）
    除了固定功能之外，「听语者」在人性化功能设计上也有所考量。例如听障者去看病、银行办理业务时可能无法听到叫号设备正在通知的号码，「听语者」增加了关键词唤醒功能，识别到关键词时该词语页面会闪烁提醒。这一设定对于听障人士而言无疑是一道安全保障，可以对生活工作中的很多情况作出快速的反应。
    而最令陀螺君惊喜的不仅是功能性强，在佩戴过程中视线的处理也十分自然，从外部也无法观测到显示内容，并且还能清晰地看到使用者的眼睛。不仅能保护隐私，在很大程度上将眼镜的“工具化”隐藏，在日常使用中更加方便自然。

    图源：VR陀螺
    与娱乐性AR消费端产品一对比，很显然「听语者」的受众相对受到限制，在功能性上也比较单一，但这正是这款产品诞生的初衷——将听障人群的需求摆在首位，解决他们的痛点。
    “少数人的需求，也应该特别珍视。”
    “我可以毫不犹豫地说这个眼镜能解决我们日常生活中90％的尴尬。”一位听力受损的摄影师夏东说道。在过去的日子里，他曾尝试过助听器、手机App、打字、写字等多种方式与外界沟通，“只要是能够帮助我获取信息的工具，让我不对别人的表达过度猜想，帮助我减少部分脑力的消耗，那就是我的需求。”
    这也是绝大部分听障人士的需求。根据《无障碍产业报告——无障碍沟通》，目前在我国听力障碍人数超过7000万，是国内数量最大的残障群体。根据Global Information的全球听力设备市场报告，全球听力设备的市场规模在2030年前将达到160．9亿美元。
    根据深圳市信息无障碍研究会《2022年中国听障用户数字产品体验调研报告》，调研发现语音转文字、声音识别、文字转语音、对话增强和手语服务功能是听障用户认为较为重要的功能，其中，对于极重度损伤用户而言，语音转文字和文字转语音更看重。

    图源：深圳市信息无障碍研究会
    同时该报告也指出，大众对听障群体的常见误区，其中包括听得见不等于听得清、听得见也不等于听得懂，受访用户反馈信息获取和理解比较困难是工作中遇到最多的问题，信息的转化是听障辅助设备需要重点优化的关键。
    即便有近7成用户会佩戴助听设备，但助听器这类产品存在的缺点也很多，例如耳朵负担大、导线易损坏、价格偏高、噪声大等，这个市场仍需要更多样的产品供用户群体选择。
    随着科技的发展，市面上的听障辅助设备也在更新迭代，更加多样化，如何突破现状，让听障群体“看见声音”、减少信息差是亮亮视野在听障辅助设备上看到的市场空白——AR字幕眼镜。

    图源：网络
    与VR硬件市场相比，AR硬件市场有着很大的不同。在技术的成熟度上，AR远不如VR的发展，无论是在光学方案、产品成本控制、量产工艺等方面存在的待解决难度更多，并且目前AR硬件没有一款在市场上得到认可的、可通用的标准产品出现。在这种情况下，不同的产品方案取舍的差别就导致在对AR硬件的探索上，呈现出了两种方式：大而全还是做细分。大而全想要面面俱到，但现有的技术显然无法使其全面兼顾。而细分市场，反而让AR产品定位更明确，从而让产品形态、内容、交互都围绕该场景优化，从而针对特定的需求提升体验。
    2012年Google眼镜横空出世再黯然收场，技术型思维拿锤子找钉子的方式在AR硬件市场上寻找买单的消费人群以失败告终。由于各项技术的互相制约，一款理想化的消费级产品难以实现，在重量、续航、发热、清晰度、大视角、算力等方面存在的代偿情况使得AR硬件更需要从基于现有场景，提升体验的逻辑打开消费级市场，在减法中逐渐加码。
    就像夏东所言，虽然「听语者」并不是一款完美的产品，仍然存在进步空间，但在日常生活中，这款产品已经给他带来的便利远超过了那些小缺点。“戴上它，我就能够准确得知别人想传达的信息，不用靠猜，也不用再过度解读别人的一个动作或是一句‘模糊不清’的话了。”
    单一的功能场景对于非核心需求的消费者或许显得无聊，但发布会后即售罄也证明着「听语者」是一款真正为听障群体带来福音的产品，用户的拥护与认可正是「听语者」将功能性发挥出作用的有力证明。陀螺君相信在未来的持续优化中，「听语者」将惠及更多的听障人士。