继续扩展机器学习 AWS瞄准了哪些方向?
常言道AWS在机器学习上的持续深耕,大大拉近了众多企业与机器学习应用的距离。
出品 | 常言道
作者 | 丁常彦
从利用机器学习技术到输出开箱即用的机器学习能力,亚马逊用了二十年时间。尤其在近几年,人工智能产业的迅速崛起,亚马逊云服务(AWS)在机器学习服务的打造上也在不断加速。
正如AWS大中华区云服务产品管理总经理顾凡所说,亚马逊利用机器学习技术已经有20多年时间,这是AWS机器学习服务的深厚源泉。2016年,AWS开始发力在云上提供机器学习服务;当年只发布了三个服务,2017年开始加速。最近三年,AWS每年新增的服务和功能超过200个,为全球人工智能工作者丰富了他们急需的工具集。
在刚刚结束的亚马逊re:Invent大会上,AWS不仅全面展示了关于人工智能与机器学习的最新全景蓝图,还宣布推出一系列新服务和新功能,从而让机器学习更易用和拓展到更加广阔的使用者、应用场景和行业。
数据爆发式增长 机器学习已经成为主流
有一个事实你可能想象不到:今天一小时产生的数据,比2000年全年产生的数据还要多;未来三年内产生的数据,将比过去30年的还要多。
面对数据的爆炸式增长,我们亟需增强处理海量数据的能力。正因为如此,机器学习和人工智能行业近年来发展迅速,并为各行业组织带来了巨大的变革空间。来自调研机构Gartner公司的调查显示,约有37%的组织在其业务中使用某种类型的机器学习技术,并且预计到2022年,80%的现代技术将基于机器学习和人工智能技术。
而在德勤发布的《全球人工智能发展白皮书》也指出,在人工智能众多的分支领域中,机器学习是人工智能的核心研究领域之一。包括89%的人工智能专利申请和40%人工智能范围内的相关专利均为机器学习范畴。
事实上,机器学习的快速崛起很大程度上得益于云计算的普及,因为机器学习历来是一个计算量很大的工作负载,只能在最强大的硬件上运行。近年来,从软件到硬件,技术的进步从未停止,云计算所展现出的能力也在不断增强。
这一点从AWS新增的机器学习服务和功能数量也可以明显看出。AWS全球机器学习副总裁Swami Sivasubramanian也认为,机器学习是我们这一代人能遇到最具颠覆性的技术之一,目前已经有超过10万客户在使用AWS的机器学习服务,很多客户已经将机器学习用于其核心业务。
但在机器学习逐渐成为越来越多企业主流应用的今天,人才匮乏的问题日益凸显,并正在成为机器学习普及的瓶颈。面对这一难题,AWS正在加速技术创新,通过打造更多“开箱即用”的机器学习服务和功能,持续降低企业应用机器学习的门槛。
对此,顾凡表示,AWS机器学习服务和功能的特点主要体现在以下三个层面:首先是服务的宽度和深度,在这方面,AWS秉持的是用合适的工具做合适的事,一把钥匙开一把锁;其次,不论在云计算领域还是在机器学习领域,AWS始终都抱着开放的心态,与不同客户的环境进行集成;第三,在服务客户过程中,AWS机器学习一直坚持两个原则:授之以鱼不如授之以渔,以及扶上马送一程,真正确保客户能够充分发挥机器学习的作用和价值。
持续创新 AWS要让机器学习走向普惠
从2016年起,AWS开始不断发力机器学习,并在云上提供机器学习服务。经过近几年的持续创新,AWS在机器学习领域已经构建起一个“全家福”工具集,真正做到了让客户可以“开箱即用”。具体来说,这个工具集总共分为三层:
工具集的底层,主要针对机器学习领域的专家,他们希望将人工智能和机器学习作为自己的核心竞争力。为了满足他们的需求,AWS提供强大的算力、全面的算力选择和丰富的机器学习框架选择。
为此,AWS不仅支持主流的机器学习框架,还可以让客户通过容器部署的方式,自带机器学习框架;而在处理器层面,AWS除了支持英伟达、英特尔、AMD、赛灵思等芯片厂商的最新处理器以外,还通过自主设计处理器。在顾凡看来,AWS自主设计的处理器可以极大地降低机器学习的算力成本。
工具集的中间层,主要面向那些技术能力较强的客户,他们有大量的数据可以进行机器学习模型训练,而且有一定的算法人才,不要花精力管理基础设施,更加专注于自己的应用和业务创新。
针对这部分客户,AWS的Amazon SageMaker可以提供首个全托管的机器学习集成开发环境,并为这个开发环境不断增加新功能,从数据准备、到模型训练、参数调优与模型迭代、到模型部署、模型质量监控,在整个过程中最大限度地提高他们开展机器学习的效率,降低他们开展机器学习的门槛。
工具集的顶层,主要面向技术能力相对薄弱的客户,他们有数据但没有算法人才,他们希望在业务场景中直接引入人工智能。AWS为他们提供预先训练好的模型,涵盖视觉、语音、对话、文字、业务工具、客服中心、搜索、代码+运维、工业AI等。
对于AWS来说,工具集的每一层都非常重要、不可或缺。只不过相对而言,工具集顶层针对的是人工智能的应用,负责推动人工智能在各行各业的落地应用,实现AI的普惠,因此近年来这一层所涌现出的服务和功能较多;但这并不代表工具集的中间层和底层并不重要。相反,以SageMaker为核心的中间层,相当于机器学习的“中场发动机”,可以为未来打造更多的人工智能应用提供强大动力,并确保机器学习的长期可持续发展;而以算力为核心的底层,则为机器学习、人工智能等构建起坚实的基础。
继续扩展机器学习 AWS瞄准了哪些方向?
如今,从媒体到汽车,从金融到工业,机器学习已经深入到越来越多的行业应用中。为了更好地满足不同行业的应用需求,就在不久前的re:Invent大会上,AWS再次推出了一系列针对机器学习的新服务和新功能,这也被AWS成为“扩圈”。
但对于AWS来说,并非所有的机器学习应用都由自己打造,对此,顾凡表示,AWS更多聚焦在架构、平台,以及行业共性问题的解决上。这一点与乐高积木颇为类似,由于不同行业的应用场景不同,因此机器学习的“积木”很多,但并非每一块“积木”都由AWS来打造,AWS主要专注于打造那些“基础积木”,让更多的合作伙伴、开发者和企业客户能基于这些“基础积木”搭建出更多个性化的场景。
在re:Invent大会上,AWS就首次推出开箱即用的工业领域机器学习解决方案,包括五项可用于工业领域的机器学习服务。这里包括端到端机器监控系统,可以监测议程并预测何时需要进行工业设备维护;通过计算机视觉改善工业运营和工作场所安全;为工业客户提供高精度、低成本的产品质量异常检测解决方案等等。
而在Amazon SageMaker方面,在过去一年交付了50多项新功能的基础上,今年的re:Invent大会上,AWS再次发布9项新功能。从数据特征提取器到数据特征存储库,从自动化工作流到模型偏差检测,从模型训练到边缘端模型质量监控和管理等,大大提升了有经验用户快速进行模型构建和训练的能力。在推出的短短三年中,Amazon SageMaker已经有几万家客户在使用。
为了将机器学习拓展到数据开发者和数据分析师群体,AWS将机器学习能力跟数据库进行嫁接,让数据库开发者、数据分析师沿用数据库查询的方式,让他们的机器学习想法落地到业务应用中。这里既有Amazon Aurora关系型数据库服务,也有可以自动将查询结果交给机器学习模型进行推理,返回结果的新功能Amazon Aurora ML,以及针对数据查询、数据仓库、图数据库等的一系列新功能。
得益于AWS在机器学习领域的持续创新,已经有越来越多的中国企业开始寻求借助机器学习技术推动自身的转型和创新,企业客户涉及工业、医疗、媒体、汽车、零售等多个行业。顾凡对此表示,相比较国外企业,中国企业非常乐于推动新技术的应用;尤其在新基建的背景下,中国企业正在加速推进数字化转型,由此带来的机器学习应用场景也在不断涌现。除此之外,来自政策层面对机器学习、人工智能等新技术的支持,也进一步推动了新技术的落地。
而在帮助企业落地机器学习过程中,AWS则始终秉持“以客户为中心”的理念,不仅积极推动机器学习功能和服务与企业客户的应用场景相融合,也在帮助客户用好这些工具并创造出价值,真正做到了“扶上马送一程”。
近年来,5G、大数据、人工智能、物联网等新一代信息技术正在加速普及和融合,企业对这些新技术的应用的广度和深度也在不断拓展。可以预见的是,在这一趋势下,机器学习应用也将呈现爆发式增长态势;而AWS在机器学习上的持续深耕,无疑将拉近众多企业与机器学习应用的距离。