福布斯:这家全球TOP初创AI公司的梦想是让人工智能懂得情感
RanaelKaliouby说,“情绪能帮助我们做出正确的决策。”但人工智能领域并不认同这一说法。研发AI不就是为了使与人类智力水平相当的机器能够作出最正确的决策,而不受人类情感、偏见和直觉等“包袱”的干扰吗?
RanaelKaliouby目前正致力于探究人工智能,研发能识别情感的智能机器。“下一个更自然的呈现方式是什么呢?”带着这样的疑问,她探索了人机互动的演变过程并找到了答案,即“对话与感知”。
ElKaliouby及其团队将正在开拓的领域称作“情绪AI”,从两方面确立了新市场:机器能够实时感知人类情绪,提供见解和分析,使各组织了解人们身处数字世界时的情绪。
Affectiva,何方神圣?
日前,英国技术公司VeInteractive做了一份榜单,列出了2017年5家顶级初创企业的名单,Affectiva是其中之一。榜单作者凯特·罗杰森说,“我们期望Affectiva在来年能够成就伟大的事情”。
事实上,Affectiva在2009年就成立了。
KleinerPerkinsCaufield&Byers(美国最大的风险基金,主要承担各大名校的校产投资业务)和FenoxVentureCapital(美国主流基金)出资3400万美元创建Affectiva,至今已与1400多个品牌(例如CBS和玛氏公司)合作过,协助他们评估并提升营销及广告宣传效率。
此外,Affectiva还把该软件提供给开发人员,便于他们向各个应用和设备增加情绪感知功能。例如:GIPHY,给GIF增加情绪和反应功能;shelfPoint,可获取零售商店顾客的交互与情绪数据;Mabu,一款私人健康机器人助手;以及BrainPower,帮助自闭症人群学习社交和认知技能。
目前Affectiva的技术研究人员大多来自麻省理工学院,由既是创始人又是首席科学家的RanaelKaliouby领导。
管理团队中还有来自硅谷的CROAlanPark,加入Affectiva前是Openwave、TrimbleNavigation等技术和服务公司的高级副总裁。COOTimPeacock在过去的17年里,帮助SaaS公司建立、领导工程团队,研发了ChoiceStream,Sermo,DirectoryM和Intranets.com等。
此外,Affectiva还拥有强大的顾问团,包括拥有20年的行为评估和干预技术开发临床经验的麻省理工学院客座教授MatthewGoodwin、ZOOMVideo创始人EricS.Yuan等。
这样的成绩,除了强大团队做背后靠山,还离不开创始人的动人事迹。
每个厉害公司背后都站着一位给力“学霸”
这一切都源于,RosalindPicard。(“情感计算”之母,她是麻省理工学院(MIT)教授,创立了Medialab情感计算研究部)
ElKaliouby还清楚记得那个瞬间,她发现可以与计算机产生共鸣。ElKaliouby以班级最优异成绩从开罗美国大学毕业后,获得优秀奖学金继续攻读硕士,此后一直在寻找合适的计算机科学研究领域。随后她读到了Picard于1997年出版的《AffectiveComputing(情感计算)》,随即“对计算机读取人类情感这一观点极度着迷,这实在是太“人性化”了。”
2001年,ElKaliouby到剑桥大学攻读博士学位时,已确定将面部表情作为研究对象。她发现人机交互(HCI)领域“不关注情感研究”,她还注意到,剑桥知名的自闭症研究中心建立了大量被标记情绪(来自演员的表演)的数据集帮助自闭症儿童理解面部表情。ElKaliouby认为,她可以用这个数据集训练算法,“这不是人机交互,而是人与人之间的交流。”换句话说,她反其道而行之,将HCI的研究方向从去计算机化(便于人们使用)变为类人化(理解人类情绪)。
论文中,ElKaliouby使用自闭症研究中心的数据训练计算机模型,使其以“堪比人类识别的精度和速度”实时准确识别复杂情绪。出于实用目的,她还发表了一篇概念论文,介绍了一个能帮助儿童实时了解对话者情绪状态的设备。她也为自己和Picard以及MIT媒体实验室情绪计算研究团队争取到未来三年NSF的资金支持。
ElKaliouby预继续从事学术研究——“我热衷于学术”——但现实不允许她这么做。
她曾向媒体实验室的赞助商(如Toyota和FoxNews等企业)展示这一研究,他们不断提出如测试电视节目和汽车植入软件等实际应用方案。2009年,elKaliouby和Picard向当时的实验室负责人FrankMoss申请更多研究资源优化应用,Frank告诉她们“这不属于研究领域,你们应该开一家公司。”
他们做到了。ElKaliouby对学术界感到沮丧。研究者会建造一个原型,用小样本测试,撰写论文,在会议上发表,然后再开始新的研究,如此循环往复。她认为:“这不会改变任何人的生活。”Picard和elKaliouby将Affectiva公司定义为“真正为市场创造东西的可持续组织”。我们可以设法通过应用情绪数据改变人们做决定的方式以此实现该定义。
将研究从“实验室”搬到“商界”
将实验环境从受控实验室转移到现实世界,搜集真实世界的数据,用来训练算法在有限条件下识别面部表情,这已成为Affectiva的一个竞争优势。该公司建立了一个独特的数据库,包含在75个国家拍摄的超过500万条视频,也就是20亿个表达真实情绪的面部框架。
海量数据帮助Affectiva利用最新的机器学习方法(即深度学习)提高准确性。对elKaliouby和她的团队来说,将研究环境从实验室转移到商界,并没有减少“推动技术发展”的动力。像其他为了发展AI离开学术界而投身商界的竞争者一样,ElKaliouby及其团队继续参与学术竞争,要么成功要么失败。
共享研究成果并不会限制AI的进步。鉴于数据收集的广度,他们可以量化文化、性别、年龄甚至环境(例如人们在家中放松还是在开车)对人们情绪表达方式的影响。举个例子,他们发现,偏集体主义的文化中,人们在身处集体环境时会克制自己的情绪,但独自在家时却非常善于表达。而偏个人主义的文化中,比如北美和欧洲,情况正好相反,人们在团体环境中比独自一人时更善于表达。ElKaliouby表示,这意味着“我们必须针对每个地理区域,建立具体基准”。
在继续收集、编码和分析面部表情(目前共收集到对应七种情绪的20种面部表情)积累专业知识的同时,Affectiva还开始分析人类情绪的另一个指标——语音。ElKaliouby表示,这是迈向对话型未来的重要一步,也是一种更为自然的人机交流方式,未来我们将与设备对话,而不仅仅指挥他们。
未来,技术将会有更丰富的情感:智能手机对情绪做出反应,汽车能感知驾驶者或乘客的疲惫、走神和心情,社交机器人将与IOT设备产生共鸣。
未来我们将能更好地理解什么构成了“智能”以及如何让计算机更好地帮助我们。
所以,真正智能=计算+情感?
查尔斯·达尔文(CharlesDarwin)在《人与动物的情感表达差异》(TheExpressionoftheEmotionsinManandAnimals)一书中写道:“表达本身或情绪语言......确实关系到人类福祉。”但是,人类发明计算机造福社会时,它们首次作为计算设备获得成功,导致AI界(甚至更大范围内)的很多研究者只专注于逻辑,认为情绪阻碍理性决策。对他们来说,智能等同于计算。
对此,RosalindPicard在《情感计算》(AffectiveComputing)回应道:“平衡情绪对智能、创造和灵活地解决问题不可或缺。如果想要计算机真正实现智能,适应、与我们自然互动,那么它们需要具备识别和表达情感的能力......”
如果elKaliouby、其他AI研究人员以及工作者能成功地教会计算机掌握情感语言,最终AI界可能会放弃追求创造“人类级智能”的目标,转而致力于使电脑成为提升人类福祉的工具。未来AI将代表提高的(人类)智能。