图灵郭家:人工智能让机器人更懂你


    图灵机器人拥有全球人工智能领域最好的中文语义技术,公司将核心技术提供给智能硬件制造商方案商,让客户的产品升级成拥有AI的智能玩具、智能家居、智能迎宾、智能客服等产品。
    
    郭家(图灵机器人联合创始人)
    11月13至14日,由OFweek中国高科技行业门户主办,OFweek人工智能网承办的“OFweek2017中国人工智能大会”在深圳举办。图灵机器人联合联合创始人郭家先生在“AI之多模态语义”主题演讲中,介绍了对于人工智能而言,语义的理解代表着什么,还有什么才是真正的智能机器人。
    AI领域的核心瓶颈在语义
    语义是AI领域的核心瓶颈,这一观点是AI巨擘马文·明斯基所说。郭家先生介绍到:“在国内,目前大部分厂商都由我们提供AI语义支持,我们公司的愿景便是让机器理解世界。”同时在大会上还讲了一个马文·明斯基的例子。当有记者问他有没有一项技术与语义同样重要,但是近期可能突破瓶颈的,马文·明斯基回答道:“没有。”也就是说目前语义已经成为人工智能亟待解决的问题。在人和人交互的过程中,很重要的信息是靠我们的交流中文字传达过来的,这过程中重点是我们如何理解决策和表达,我们公司理念是持续深挖语义的技术,最终让机器理解人理解世界。
    
    在大会上,郭家先生还举了几个例子,比如,美国独角兽公司的Blue River,其实还只是smart machine,不能被叫智能机器人;再比如,机器人RoBoHoN,售价约合2万RMB/台,在日本已卖了3万台,当然这也与日本所处的环境有关,它所对应的场景主要是“男朋友送女朋友”,“家长送小孩”,以及“老人用”。通过这几个例子说明了什么才是我们认为的真正机器人。
    多模态交互
    富士康找到图灵说要跟你们合作做产品,我们说出了提供对话功能还要提供什么,他们说要把对话做到不仅仅是对话,还包括它的动作和表情,我希望把他们串在一起,我们紧接着想到了我们在很多年前研究过的技术,就是刚才讲到的多模态交互,多模态语义,我做一个动作说你和我,这个动作其实和我的语言是完全串在一起的。
    
    有记者向世界数一数二的人形机器人科学家高桥智隆提问,机器人和手机的最大区别是什么?而在高桥智隆眼中,如果做一个人形机器人,或者是有人性的东西出来,那不光是能讲话,它的动作表情是能给你反馈的,就像我们养狗和猫就是他们能给你反馈,这就是我们做这个产品的理念,梅拉必安沟通模型,我们人和人交流过程中,纯文字只有7%,声音语调占38%,视觉肢体占55%,我们所有的交互过程中,其实纯文字的东西只是很少的一部分,大部分的信息是通过语音语调及表情和动作传达给对方的。
    在国内目前图灵的多模态交互技术,至少是领先同行业一年以上,因为大家知道有做语音交互的公司有做视觉交互的公司,有做语音加视觉的公司,但是做多模态的输入和输出的,以机体神经元为基础的这种几乎还没有。
    最后郭家先生还举出了一个例子,一个合作案例是我们现在跟耶鲁大学在探讨合作,它那边给出的模型,一个小朋友,在玩一个游戏,第一张图是纯粹的在电脑上学习,第二张图右上角放一个小鸡会给他做一个时时反馈,第三个放一个真的玩具小鸡不仅会给他反馈还有动作反馈,比如这道题做错或做对了,他那边研究学习效率直线上升,这也是我们深挖儿童学习场景的重点方向。
    更多详细内容,敬请关注OFweek人工智能网后续专题报道!