AI探险日记:乘上星际飞船探索AI宇宙
当下科技文/当下君
对于AI大规模落地这件事,目前国内的氛围喜忧参半。
近忧远虑的人,一般反而是真正的AI行业资深人士,或者是资深投资人,他们看到了场景限制、数据制约、人才短缺、成本高昂等方方面面的具体困难,他们的忧虑是有道理的。
的确,AI在落地中面临的问题非常之多,而且,应用场景分散太严重是AI应用落地的一大瓶颈。AI并不是万能的,在使用上经常受限于场景、数据、开发能力、企业拥抱新技术的态度等等问题。
一部分人认为,随着用户对AI应用的诉求变得越来越个性化,AI企业所提供的产品和解决方案也呈现定制化,AI企业必须贴地而行,尽可能多的参与到产业垂直场景和工程落地中才能生存。而另一部分人认为,较好的办法是,打造一个开放的AI平台,提供综合性的方案来解决AI落地面临的诸多挑战,而分散场景的定制化问题,平台应该交给生态伙伴解决,或通过提供更好的工具让客户自己实现。
后一条路听起来很美,但实践起来也很苦,百度就是后一条路上的代表企业,而其对于AI融入社会化大生产的实践和推动,堪称现实版的《探险日记》。
1
孤独的探路先行者
AI的落地,并不总是轰轰烈烈,也有雪落无声。
6月24日,世界银行执行董事会批准给中国提供贷款4.3亿美元,其中的1.5亿美元贷款将用于宁波的垃圾分类。
宁波开启了先进的垃圾管理、循环利用和预防措施,在国内属于领先位置。
简单说,宁波的垃圾处理,在分类后如何进一步处理,已经非常现代化,此次的世行资金,主要用于宁波全品类智能回收箱的落地,解决消费者如何分类投放,进而完善闭环。
机会往往留给有准备的人,宁波蔚澜就是这样一家企业。此前,它是一家生产物联网配电柜的企业,公司负责人范世杰非常关注市场动态,在2018年底,当他看到央视开始宣传垃圾分类时,立刻产生了一个念头——垃圾分类柜这种东西,本质上和物联网配电柜的差别不大。
新型的垃圾分类箱很快做了出来。居民对可回收垃圾的分类意识明确,但厨余垃圾分类就出现了困难。很常见的一个问题就是,居民在分类时不够精细,把其它垃圾混杂在厨余垃圾里,这就涉及到两个动作——需要对垃圾进一步分拣,还需要提醒居民下次注意类似问题。
为什么说厨余垃圾是一道门槛?主要是因为这种垃圾的形态、外观都很复杂,传统的视觉识别手段的精准度有限,成为产品的软肋。
让范世杰感到幸运的是,公司新招来了AI技术总监杜一品,大家都知道AI的人才奇缺,有完整的AI开发经验的人更少。
对于这种现象,百度集团副总裁吴甜称之为“AI先行者探路”阶段。
吴甜在解读百度飞桨深度学习平台与产业伙伴的广泛合作中所观察到的AI落地实践路径时,把这条路描绘为三个阶段,也就是AI先行者探路阶段、AI工作坊应用阶段和AI工业大生产阶段。
企业中的AI先行者,深谙业务场景中亟待解决的难题、有想法,想要突破传统的业务现状,希望借助AI的力量走出一条不一样的路。
杜一品正是如此,蔚澜并没有完整的AI团队,但是,他也有一些底气,因为掌握了新的工具——飞桨企业版EasyDL。
EasyDL是一个零门槛AI开发平台,开发一个AI模型的流程中,涉及的数据处理、特征提取、模型选择、参数调节、训练部署等环节,都实现了高度的自动化,经过简单学习即可运用。
杜一品用EasyDL轻松完成了厨余垃圾识别模型,另一个问题随之而生,垃圾箱端侧的识别需要比较高的AI算力,如果回传到云端计算,就需要企业添置大量的服务器、GPU卡等资源,这极大的增加了利润本身薄如刀锋的垃圾回收企业的成本。
就在这个时候,飞桨工程师给他支招,不需要购买庞大的AI计算设备,只需要一个百度的“EdgeBoard嵌入式AI计算卡”再搭配两个普通的摄像头就可以解决“成本高”的问题。最终,蔚澜也正是采用飞桨工程师的建议成功实现了AI的初次实践落地。杜一品说了一句很感概的话:“我们的设备成本只增加了大约2-3%,就让我们从自动化时代进入了智能化时代,原来AI也不那么贵。”
蔚澜的智能垃圾回收箱因为厨余垃圾智能识别这一项能力,在市场上赢得了竞争时间窗口。这就是AI的力量。
事实上,像杜一品这样的AI先行者还有很多。
王健(化名)是一家新能源电池企业的资深工程师,他最头疼的问题,就是电池的质检环节。
对电池进行质检,除了通电测试外,很重要的一个工作其实是非标准化的,得用肉眼去看,要仔细观察——金属焊接产生的颗粒是否掉在表面、有没有漏涂、焊接工艺是否一致等等。但是,传统以肉眼为核心的检验,存在准确率低、人才培养困难、生产环境中有害成份可能影响质检员健康等问题。
王健是一个乐于钻研新技术的人,他发现,飞桨的官方课程,是他在互联网上能找到的、现有的、最有效的能够帮助他快速进行应用研发的入门课程,于是他开始了自学,进而他开始思索,认为百度飞桨在视觉方面的强大能力,可以是解决肉眼质检效率低、标准化程度低的一个新办法。
王健是先行者,但同样是一个AI新手,他想办法联系到了百度飞桨,并获得了强大的支持。在合作的过程中,包括从模型选型到训练优化,再到部署以及与原有系统的集成,飞桨团队不仅提供了编程框架和模型库产品,还与王健在项目落地的各个环节展开了多次的交流和答疑,给予了全方位的技术建议和支持。
“我们希望,把产品线上的电池缺陷漏检率从小于百万分之一,优化到小于十亿分之一、单张产品图像缺陷检测平均时长小于2毫秒”,王健说:“但这不是一件容易的事,涉及的细节有300多个,包括黑斑、划痕、黑点、厚涂、凹点等等。”
对于这些问题,飞桨“平台式赋能”的优势就显现出来,因为他们拥有的不是一件或几件“武器”,而是一整个“武器库”,通过百度飞桨深度优化过的PP-YOLO和ResNet系列算法,王健团队提升了算法精度,加之飞桨 PaddleX 全流程开发工具的选用,大大地降低了应用深度学习技术进行产业落地的难度。
“最后,相较于传统的算法,应用了飞桨模型库的检测算法,过杀率降低了 66.7%,缺陷漏检率小于1DPPB,在多个产品线上进行迁移部署的效率也得到了全面提升”,王健满意的说,他也从这个项目中深深受益,成为了公司里AI技术改造的带头人。
杜一品和王健的经历,正是典型的“AI先行者探路”阶段向“AI工作坊应用”阶段转化的案例——总有那么一些人会愿意尝试新的技术,尽管这个过程或许很孤独。
所谓的孤独,不仅仅是没有人可以交流、讨论、共创;也可能是因为AI技术不被决策层理解,而仅仅靠技术人员是很难推动一类新技术落地的。
但一旦进行了验证,成功落地后,就会从个人实践,变成企业有内驱力,来建设团队学习和应用AI,从而进入吴甜称之为“AI工作坊应用”阶段。
先行者探路往往是孤独的,飞桨的陪伴让他们不再感觉是在独行。
2
AI探险之旅,需要不断进阶的能力
目前,绝大多数企业的AI实践,还都处于前两个阶段。
必须指出,百度并不是被动的等待企业在应用AI上自行进化,对三个阶段的总结也不是静态的总结,相反,百度飞桨正是发现不同的企业分布在三个不同阶段,所以通过这些丰富多样的需求,主动打磨飞桨的技术和产品,使它能更好的满足处在不同阶段的企业的实际业务需要,进而帮助企业成长到下一个阶段。
对于进入到AI工作坊应用阶段的企业,百度飞桨的做法就是帮助这些宝贵的“星星之火”在学中干、干中学,最后使他们成为企业内部AI之火燎原的“火种”。
但这个过程,并不容易。
如果你看过肯·福莱特的《世界三部曲》或者欧文斯通的《梵高传》,你一定对上个世纪初的煤矿工人生活的危险和悲惨印象深刻。
即使在新中国,1949年的煤炭每百万吨死亡率仍然高达22.54,而足足经历了60年后的2009年,这个数值才首次低于1,也就是每生产百万吨煤的死亡人数少于一人。尽管如此,当年煤矿死亡人数仍高达2700人。
“只要这个数字不归零,我们就还要继续努力,终有一日,我们会实现 ‘井下无人开采’的梦想”,华夏天信(北京)机器人公司总经理高强告诉笔者:“在矿用机器人领域,我们需要通过成熟可靠的AI解决方案来打造智慧煤矿,平衡安全与效率。”
华夏天信有一支精干的开发团队,但这支团队在面对“输煤胶带机器人智能巡检”的开发时,也遇到了技术的拦路虎。
如果一个人没有下过井,就很难想象里面是什么场景——在距地表几百米的深处,输煤胶带昼夜不停的将煤炭运送到地面,一般的输煤胶带动辄几公里,如果完全靠人力现场巡检或远程摄像头查看,那需要很多的巡检工人,这样不仅增加了井下人数,耗时耗力,而且难免误看漏看,存在安全隐患。
对于这个场景,最简单的方式是使用搭载通用检测算法的摄像头,可以进行简单的人员入侵检测、边界检测等,但这种方案无法满足井下光线较弱的复杂场景。有人建议使用比较通用的AI能力平台,选择适用的模型加以改造,但这需要很强的AI开发能力。也有人建议,直接使用一些第三方公司提供的API,但事实上,由于井下的网络传输环境异常恶劣,做不到满足实时性要求。
华夏天信找到了百度飞桨,这一次,他们在飞桨的“武器库”里找到一个端到端目标检测开发套件PaddleDetection,通过数据增强、算法选择等技术很好地解决了输煤胶带机器人实际遇到的场景难题,同时飞桨还打通了AI应用的最后一公里,提供了多端多平台推理部署工具链,帮助技术人员将AI应用高效落地。
1 2 下一页>