WAVE SUMMIT 2020:飞桨企业版EasyDL全新发布
你是不是也曾在人声鼎沸的超市里,刚精挑细选好几样新鲜蔬菜水果,扭头却看到待称重的队伍已排到“天际”。生活真是时不时就要来点无奈,打散你我心里的“小确幸”。那是否存在一种“聪明”的机器,它可自行辨认物品并结合重量“一步到位,自食其力”地计算出总价,免去排长队等称重的步骤呢?事实上,它存在——飞桨企业版EasyDL零门槛AI开发平台的全新升级带着更快速易用的解决方案来了!
5月20日“WAVE SUMMIT 2020”深度学习开发者峰会上,百度AI开发平台部总监忻舟宣布EasyDL全新升级,重磅发布了业内首个专注于AI开发领域的智能数据服务平台EasyData,进一步加强数据管理与加工能力,并在完整地支持Master模式的训练与开发、端云一体服务部署方面带来了4项重要升级。
(图:EasyDL平台的全新发布与重要升级)
据介绍,EasyDL已成为目前市场上重点面向中小企业功能最全的一站式AI开发平台。以“简单、专业”为最核心理念的EasyDL希望通过平台建立一条连接需求和复杂技术之间鸿沟的桥梁,帮助开发者实现零门槛AI开发,从繁杂的数据准备、环境配置、代码开发和服务部署中脱身,专注于业务与创新。
由于大量开发者在结合业务进行模型训练前,常常深受“数据”一环的困扰,因此EasyDL此次全新推出EasyData, 面向AI开发领域,提供了一站式数据采集、清洗、标注、扩充、数据闭环等能力,与EasyDL模型训练和部署环节配合,帮助开发者更高效更低成本的解决AI开发及应用过程中遇到的数据问题。
首先,在采集环节EasyData提供了业内首发的软硬一体、端云协同的自动数据采集方案,极大降低了开发者在“设备选型、调测和集成开发工作上的成本”,将数据采集效率从“周级”提升到“小时级”。紧接着,针对采回的数据,平台还提供自动数据清洗方案,将人工处理成本降低80%。而针对AI开发中另一耗费时间的“数据标注”环节,EasyData可提供丰富的智能标注方案,支持物体检测、图像分割和文本分类三种任务场景,只需标注少量数据,即可通过启动“智能标注”自动挖掘难例,并通过标注难例加速提升系统效果。与以往相同任务相比,基于EasyData智能标注解决方案,达到同等模型效果的数据标注量平均减少70%。在之后的模型训练与发布环节,自动数据闭环使得整体模型迭代周期从月到周甚至到天,极大提升了AI开发全流程效率。
举例来看,果蔬智能识别系统开发企业中科立业基于EasyDL快速开发的“智能云秤”已落地20家店铺,通过秤上的摄像头来智能判断商品,实现称重结算一步到位。而在此前的实际开发中,中科立业遇到遮挡、光线影响、样本多样性等数据问题,在接入EasyDL后,基于EasyData 的自动去模糊、过滤无效图像、智能标注和数据增强,每天可以自动收集7000张有效样本,整体减少了80%的数据处理量和70%的人工成本,通过EasyDL Master模式,快速实现模型开发,对50种水果实现智能识别,准确率超过95%。
此次峰会中,EasyDL平台除了针对数据管理方面全新发布了EasyData,还针对AI开发中的其他环节进行了4项全新升级。首先,EasyDL平台对预训练模型、预置算法进行了升级,使Master模式应用更简单高效。如在NLP领域预置了效果领先的ERNIE2.0模型,将持续针对医疗、法律等专业领域扩展“领域模型”;在CV领域则预置了“超大规模视觉”预训练模型,大幅提升通用分类和检测的模型效果,并在零售、安防等领域发展场景化预置模型。EasyDL平台目前共预置了36套经典NLP网络与模型组合、26套经典CV网络与模型组合,支持开发者更加高效快捷地进行模型开发。
其次,自动数据增强和超参搜索能力也针对实际的工业应用做了优化。其中,自动数据增强方面,平台开放超过40种数据增强算子,可灵活配置,基于工业级搜索算法实现更高的搜索效率。同时,对于自动超参搜索,创新基于随机微分方程的无梯度优化的调参算法,收敛速度快,不依赖平滑性假设,可支持大规模并行搜索调参。这使得EasyDL线上多场景模型精度平均提升10%以上。另外,分布式训练加速也是EasyDL平台的一大特点,基于PaddlePaddle DGC的优化,在常见的没有专门经过通信优化的公有云环境中,能够使训练时长平均减少70%。
总体来看,由于AI核心算法发展迅速,效果和复杂度不断提升,并且涉及到数据处理、环境配置、结果分析、模型部署、运行监控等等,庞杂繁复的各环节,让专注于各自领域的企业,对于所需的“定制AI开发”往往存在门槛过高的现象。而EasyDL为了让各领域企业在进行“智能化”升级时可解放更多人力与资源聚焦在业务与创新上,在降低技术门槛、加快开发的同时,也确保了核心AI开发体验的顺畅和效果。例如,瀚才猎头作为一家只有5个人力资源专家组成的创业公司,借助EasyDL智能标注和预训练模型ERNIE,公司的人力资源专家轻松快速,且具有行业创新性地将房地产行业“简历数据”建立了分类模型,针对100多个细分职业和11个通用职级进行分类,让员工在面对“背景经验差距巨大”却是同一职位名称的候选人时可进行更高效的筛选匹配。而该模型只使用了1万条标注数据,就达到了95%以上的准确率,让人才检索效率迅速提升200倍。