深度好奇:深挖语义理解,助力打造机器版“福尔摩斯”
人与人之间说不同语言,尚且会出现沟通障碍,当人类和机器交互时,这种障碍则会变成巨大的鸿沟。毫无疑问,人工智能是时代发展不可逆的技术趋势,而作为这个时代的核心参与者——人与机器,如何更好地交互始终是待解问题。其中,最关键的是让机器能够理解人类的语言。
市面上已经出现了大量的自然语言处理(NLP)企业,致力于人机之间的语言交互问题。不过,人工智能企业深度好奇则将研发的重心细化到 NLP 领域的核心——自然语言理解(NLU),以挖掘深度语义理解的商业价值。NLU 旨在把人类语言翻译成机器可以 “读懂” 和 “使用” 的形式,即把非结构化的数据变成结构化的、机器容易操作的东西。当文本变成机器可以读懂的结构化信息时,同一流程上的很多操作就可以让机器来做,或者让机器之间进行某种形式的交互。
与 NLP 相比,NLU 更加深度垂直,就像 “深度好奇” 这个名字一样神秘。该公司的创始人兼 CTO 吕正东,曾任职于微软亚洲研究院、华为诺亚方舟实验室,长期从事机器学习和自然语言处理的研究。作为自然语言处理领域的专家,他创业的初衷是做出具有崭新技术高度的语言智能产品。
不过,由于公司切入点比较深入,吕正东笑称很多人不理解他们在干什么。“我们希望形成一个完整的行业语义图谱,一方面,它能够和其他结构化信息做无缝连接,另一方面,它可以直接辅助行业专家的决策。” 吕正东介绍到,公司的愿景是探索理解人类语言的算法,并且创造服务于行业的人工智能。
据他介绍,深度好奇最开始涉及的领域是法律,现在主要在公安和金融领域中做应用,代表性的例如智能审讯类产品和智能风控产品。以公安相关场景为例,吕正东介绍到,深度好奇有两大技术框架,一是做复杂文本的解析,即将复杂的文本转化成语义图谱;二是基于语义图谱进行推理,包括图谱之间的比对、融合、预测、分析等。
案件里的信息主要体现为文本形式的非结构化数据,深度好奇首先需要对文本数据进行结构化,从而串联整个案件已知和待确认的信息,形成一个完整的语义图谱,这即是语义解析平台的功能。此外,深度好奇还有一个推理平台,可以用来处理语义图谱与其他信息的融合、比对以及在此之上的预测和行动建议等。需要说明的是,在侦破过程中的很多信息是模糊和待确认的,推理平台会通过多信息源的比对以及和人的交互,来逐渐完成对信息的丰富和清晰化。随着事实性信息的不断完善,该图谱会变成一个越来越完整和清晰的对案情信息的综合表征。
吕正东表示,公安场景是 NLU 可以大展拳脚的领域。“其实,在逻辑层上大有可为。之前很多企业已经在感知层上获得了快速成长,但总的来说,感知层市场的增长已经大幅放缓。” 他认为,公安方面接下来更亟待解决的任务,就是如何在认知层和逻辑层把数据串联起来形成解决方案。
与医疗领域有着较为相似的痛点,公安领域也面临着专家资源的缺乏以及与时代的脱节。“新警察缺乏经验,老警察也在被一个问题所困扰:他的经验未必能和最新的侦破手段结合。“吕正东说。所以,在这样的背景下,亟待一个既能融合老警察办案思路,又能以极速的方式接触到各种信息、适应最新侦破手段的解决方案。吕正东表示:“目前世界还没有技术能一开始就做到机器版的福尔摩斯或者狄仁杰,但是我们可以在一些局部进行突破,先提高警察的办案效率,逐渐就会串联起一个更完整、更强大的解决方案。”
据悉,深度好奇在公安市场的商业模式目前主要有两种:其一是将产品直接销售至公安局,用户已覆盖多个县区级公安局、地市级公安局和省厅;其二是与不同类型的平台型公司合作,通过他们的渠道进行市场推广。显然,深度好奇的技术产品在效果与落地方面均有所成,未来也可能衍生到其他领域。
深度好奇已经于 2016 年底完成了合力资本及阿米巴资本的天使轮融资,目前对于新一轮融资持开放态度。