微软小冰最大规模全面升级：开始“靠脸吃饭”

2024.03.28

    7月26日，第六代微软小冰在北京发布。与往年一样，发布信息量非常大。
    其中，令人最为期待和惊喜的就是小冰3D形象的亮相。在发布会现场，小冰以全息形式“出道”，不仅进行了自我介绍，还伴随着动感音乐以歌舞形式完美演绎了自己的歌曲。
    这是微软第一次走出微软大厦，以科技感十足的形式举办小冰的发布会。用微软全球资深副总裁王永东的话说：“因为今天的小冰需要这样一个空间和挑高让大家重新认识她。”
    从现场的反应来看，大家对小冰的清纯美少女形象颇为满意。而从过去的成绩来看，小冰表现得也相当给力。
    据披露，经过过去4年的数次迭代，小冰已经“踏足”全球5个人口过亿的国家，在40多个不同的平台上拥有6．6亿的用户，其中月活跃用户超过1．2亿。
    在这样一个形象和人设背后，第六代的小冰还集成了微软在人工智能领域的诸多突破，包括对话引擎与交互感官等核心技术的升级、在合作平台上的产品更新和新产品推出、在各领域的应用和商业化进展、Dual AI生态化战略的发布等等。
    如微软全球执行副总裁介绍，如今小冰已经正式从一个智能对话机器人，“成长”为一个一个以情感计算为核心的完整人工智能框架，再从计算框架转化成各种产品形态，通过各个垂直领域深入到人们生活的方方面面。
    技术升级：上线共感模型、全双工语音和实时视觉
    从诞生之初，微软就一直强调要让小冰拥有足够的EQ，这是让她与人类“愉快玩耍”的基本前提。因为要让一个智能机器人不把天“聊死”，就要让她拥有可以控制与人类的对话全程的能力。
    为此，微软在去年第五代小冰中引入了生成模型，使得小冰可以在互动中更好地联系上下文，并自创回复，而不需要从已有的对话语料库中检索得到答案
    而在此次发布会上，微软又基于生成模型上线了全新的共感模型，进一步提高小冰对于对话内容、领域和节奏的控制力，通过自创回应牵引对话向她所希望的方向进行。“在对话过程中，小冰会在回应中应用自己的策略，主动观察并不断求证，试图找到人类在话题中的兴趣点，在对话中‘带动节奏’。”
    微软小冰负责人李笛表示：“目前，微软已经完成了共感模型的测试，并正式在小冰所覆盖的5个国家正式上线。”
    此外，同样是在第五代小冰发布会上，微软还完成了全双工语音交互感官的产品化，并在打电话和智能音箱设备两个场景中落地。
    基于此，此次微软又融合了共感模型的对话引擎、全双工语音和实时视觉三个类别的全新感官，让小冰在与人的互动中拥有视觉，可以看到对方的“一举一动”。
    在发布会现场，微软放置了用于体验的测试设备。通过该测试设备，小冰可以通过视觉、语音的实时连续交互，指挥用户完成面容检测，并在上述过程中进行开放域的对话。
    据微软预计，该感官将于一年内完成全部产品化工作。
    创造力升级：“戏路”越走越宽
    随着技术的不断升级，小冰的“戏路”也越走越宽。
    如今，小冰已经不再只是微信、LINE等社交网络上的聊天机器人， QQ群中的人工智能助理，网易新闻评论区的“段子手”，她还在很多电视、电台中充当主持人，同时还能进行内容创作。
    微软认为，利用人工智能技术，学习人类并进行与人类质量水平相当的内容创造，是重要的、但目前尚未被行业注意到的未来趋势。目前，微软小冰已通过人工智能技术，实现了诗歌和金融等领域的文本内容生成、歌曲及有声读物等领域的有声内容生成，以及电视电台节目和可交互式电台等串流内容领域的生成工作，并分别完成了不同程度的落地。
    2018年6月，微软（亚洲）互联网工程院专门成立了人工智能创造事业部，从而进一步推动小冰在人工智能创造这一内容领域的生产线搭建及产业化落地等工作。
    发布会上，微软发布了最新的第四版人工智能歌曲DNN模型。与前三个版本的技术相比，第四版能够进一步快速合成与人类歌手质量相当的歌曲，并能够使人工智能小冰自由吸收多数人类歌手的演唱技巧，融会贯通，在演唱过程中达成更加成熟的演绎。此外，该技术还能够完整吸收并复制特定人类歌手的全部演唱特质，比如嗓音、韵律等等，使小冰能完全代替原人类歌手完成新作品的创作。
    小冰首席语音科学家栾剑在会上宣布了与多个大众文化公司的合作，并表示已经完成部分人类歌手的人工智能化工作。同时，他还在现场演示了小冰演唱的第四版歌曲《隐形的翅膀》。


    1  2  下一页>