从百度大脑开放日谈起:你身边的每件小事都可以与AI有关
Alter聊IT中关村创业大街,这个曾见证互联网创业热潮的著名地标,也曾陷入冷寂。
而今,”智能+“已经成为时代新命题,这条大街又因AI有了新的活力。
去年12月底,百度大脑在中关村创业大街开设第一家“线下体验店“,引来人头攒动。3月20日,首期百度大脑开放日在中关村创业大街举办,更多了一份热闹。
过去,在创业大街上生长起来的很多互联网产品与技术已经与我们的生活难以分割,如今AI到来,又会是一种什么景象?
在百度大脑开放日上,百度大脑带来了24种全新开放的AI技术,20个鲜活的落地案例,用满满的诚意与开发者一起展开对未来的想象。
用AI的热度 去温暖每个角落
整场开放日,最令人印象深刻的案例是“智能猫窝”,看到冬天里无家可归的流浪猫,百度大脑工程师晚兮利用百度大脑的动物识别技术和百度EasyDL,打造出了配备“猫脸门禁”、“病猫识别”、“绝育识别”三大黑科技的猫窝,不仅可以识别174种不同品种的猫咪,还可以识别猫口炎、猫鼻支、猫皮肤病、猫外伤4种常见猫病,发现未绝育的猫,帮助志愿者及时救助。
和流浪猫一样,垃圾分类也是一大社会难题。分形科技借助百度EasyDL的图像分类技术,打造了首款智能垃圾桶,可以对7种常见垃圾自动分类;
德邦物流为了让用户免去自行填写信息的麻烦,使用百度大脑的定制词法分析快递申请,一秒拆分姓名、电话、住址等信息;
看到审批窗口总是排满长队,科鸿智信利用OCR 、iOCR及EasyDL平台开发了智能化审批管理系统,建立起“一次都不跑、随时随地办”的便民服务新模式。
嫌弃鼠标的功能太鸡肋,有开发者集成百度的语音识别和合成技术、翻译技术 ,打造了智能语音鼠标,语音输入速度可以达到每分钟400字,比传统键盘输入提升了两倍,并且支持28种语言的翻译;
还有开发者为了方便控制跑步机,使用百度大脑的语音识别和UNIT技术,开发了可语音控制的跑步机,动动嘴就可以切歌、速度控制、模式变换等,据说月销量已经高达一万台以上。
以上这些在开放日展出的案例,只是百度大脑落地案例冰山一角。2018年百度大脑在6个城市举办了7场行业创新论坛,针对企业服务、信息服务、地产物业、智能零售、智能工厂、智能校园、智能政务推出了7大行业解决方案,AI能力已然渗透进产业的毛细血管,从而影响我们生活的方方面面。
正如百度AI技术生态部总经理喻友平在现场所说,“人工智能应用的领域可以说无处不在,只要企业、开发者、合作伙伴们能有发现问题的眼睛,就有创新创业的机会。百度大脑把平台和AI能力开放出来,希望帮助大家快速地实现各自领域的业务解决方案,创造全新商业模式,带来更多机遇。”
研发不是炫技 是对技术赋能的践行
作为百度在人工智能领域多年研究的集大成,百度大脑在2016年正式开放后,已经开放了语音技术、视觉技术、自然语言处理、知识图谱、机器学习等近160项通用AI能力,有着超过100万的开发者,已然成为服务规模最大的AI开放平台。
对于百度大脑而言,技术的创新并没有尽头,就像是一场“打怪升级”的游戏,一直追求的是怎么让技术更好用,怎么将效率再提高一些,最终实现“用AI让复杂的世界更简单”。
在百度大脑开放日当天,百度AI技术生态部总经理喻友平一口气介绍了新开放的24项AI技术能力,囊括视觉、自然语言和语音。以往开发者要苦苦研发上月的技术,在百度大脑都可以一键获取。开放一个全新的AI技术,开发者就可能创造出一个全新的AI应用,实实在在改变生活。
在视觉方向上,OCR、车辆分析、人脸识别、图像识别都有数项更新。百度的OCR全系列产品多达34种,覆盖了卡证、票据、文档、汽车等场景。
如果你是一名户籍系统相关的开发者,只需要对着户口本拍一张照片,系统就能字段进行结构化识别,然后反馈出信息页的出生地、出生日期、姓名、民族、与户主关系、性别、身份证号码,将会帮助相关工作人员减轻大半的工作量。目前,百度在OCR上的能力最为全面,对于开发者来说,在同一家平台上就能找到应用场景的对应技术,十分便捷。
如果你是一位交警或者停车场管理员,一定会对百度大脑的车辆分析技术点赞。百度大脑推出了车辆检测、车流统计、车辆属性分析、外观损伤识别等服务。其中车辆检测功能,可以通过识别图像中的所有机动车辆(包含小汽车、卡车、巴士、摩托车、三轮车),反馈每辆车的类型和坐标位置,并对每类车辆分别计数。
如果你是一名自拍爱好者,百度大脑显然知道你想要的是什么。百度大脑新增了人脸情绪识别,并升级了人脸关键点检测和手势识别,人脸检测关键点由72个增至150个,常见手势能识别也达到了24种。这些技术落地之后,人脸识别不再局限在解锁和美颜,将带来更多有趣的应用:录制短视频时有更丰富的手势特效,识别你的情绪自动匹配背景音乐等等。
语音和语义识别也是百度大脑升级的重点,包括语言处理应用平台、语言处理应用技术、语言处理基础技术、知识理解以及知识图谱。
在百度大脑开放日上,令人印象深刻的演示是三个有趣的应用:
一是新闻摘要,对新闻内容进行全面的语义理解与分析,然后自动抽取新闻文本中的关键信息并按指定长度生成摘要,可以应用于热点新闻聚合、新闻推荐、语音播报、弹窗推送等场景,几乎是所有新闻工作者的福音。
二是智能写诗,用户只需要输入任意主题词(如公司名、节气名),百度大脑便可自动生成融合了该主题词的诗词。实际测试显示,百度大脑的智能写诗在语义和语境上并没有明显的违和感,不失为娱乐化营销的又一重要工具。
三是智能春联,今年的央视春晚上,主持人高博就演示了智能春联“看脸”的绝活儿,通过“刷脸”生成专属春联。如今这项技能也被百度开放出来,何尝不是人工智能融入美好生活的一个典型案例呢。
在语音方面,百度首次对外开放了搭载国际领先的注意力(attention)模型的语音能力,拥有更快的响应速度,相对识别准确度提升15%。同时中英文混杂和纯英文自由说,既能识别方言又能识别普通话,那些曾经让用户和开发者头疼的问题,在这里被一次性解决。
不止如此,百度还即将上线很多新产品:零代码自助训练语音识别模型,可以帮助开发者提升业务场景下的识别准确率;而远场语音开发套件,则可以应用于机器人、儿童故事机、家电、车载设备等硬件,语音识别将无处不在。
在喻友平看来,百度大脑的开放生态有着以下优势:一个是技术领先,百度很早就成立了深度学习研究院,并且早在16年开源了国内第一个深度学习框架paddlepaddle,在各类国际比赛上也取得过非常多的奖项,并且联合举办了像上面介绍的国际权威竞赛,在这样的技术号召力下,聚集了非常多的人才,这是技术得以持续保持领先的基础;
一个是技术布局非常全面,从感知到认知,从语音到视觉到语义到AR等等,非常全面,可以帮助大家一站式的获得服务,提高集成效率;最后,我们以可落地为目标,在降低人工智能应用门槛的这个方向上持续不断的努力,所以虽然只开放了两年多的时间,但进化速度也非常快。
“我们可以看到整个平台的架构,从模型到软硬一体,从深度学习框架到解决方案,从云服务到多种输出方式的支持,各个层面都快速丰富起来。我们也非常重视各个企业和开发者提出的需求,并且特别感谢在这个进化过程中大家的包容与支持。”
艺术家们喜欢让人们从作品中了解自己,如同在蒙娜丽莎中思考达芬奇,在第九交响曲中听懂贝多芬。
百度大脑似乎有着同样的情愫:用开放生态,为开发者提供发挥想象力的“黑土地”,让AI走向社会的每一个角落。
喻友平谈到,人工智能应用的领域可以说无处不在,只要企业、开发者、合作伙伴们能有发现问题的眼睛,就有创新创业的机会。百度大脑把平台和AI能力开放出来,希望帮助大家快速地实现各自领域的业务解决方案,创造全新商业模式,带来更多机遇。