南京大学黄宜华:自动化机器学习AutoML 让AI设计AI
以深度学习为代表的新一轮人工智能浪潮汹涌,同时,在大数据与超强计算能力的支撑下,正在不断赋能产品、企业与社会,人工智能技术已经广泛渗透众多的垂直应用领域。作为最受瞩目的AI技术,AutoML(Automatic Machine Learning, AutoML),自动化机器学习,即用机器去自动化的完成模型选择和参数调优,让模型设计自动化,替代人工方式进行模型设计的过程,从而大量节约人力,提高建模的效率。换言之,就是以AI设计AI,未来将有助于缓解目前AI开发者供不应求的局面。
AutoML在人工智能顶级编程人才匮乏的情况下应运而生,一般机器学习首先需要大量的训练数据,再由机器学习工程师/数据科学家对数据进行分析,设计算法形成训练模型;这需要大量的专业知识。如果使用AutoML,就像是在使用一个工具,只需要将训练数据集传入AutoML,那么这个工具就会自动生成参数和模型,形成训练模型,这样即使不具备机器学习方面深入的专业知识也可以开发机器学习模型,它也有望缩短数据科学家用来创建模型的时间。未来预计会看到更多的商业AutoML软件包、更庞大的机器学习平台里面整合AutoML。
2018年8月31日,作为“OFweek(第二届)中国人工智能产业大会”的重点论坛之一的智能机器人专场论坛在上海跨国采购会展中心成功举办。本次专场论坛围绕人工智能技术在机器人应用落地,就智能机器人的发展现状、市场趋势、技术难点等核心环节进行了多方分析与探讨。
在本次论坛上,南京大学(PASA大数据实验室)黄宜华教授发表了《自动化机器学AutoML研究进展》的主题演讲。
南京大学(PASA大数据实验室)黄宜华教授
黄宜华教授为我们简单介绍PASA(Parallel Algorithms Systems Applications)实验室:作为国内高校最早从事大数据技术研究和教学的团队,自2009年开始全面进入大数据领域,在分布式大数据存储和查询、分布式文件系统、大数据并行计算模式与系统、Hadoop/Spark/Alluxio性能优化与功能增强、分布并行化机器学习和数据挖掘算法、大数据机器学习系统、大规模文本语义分析、大数据行业应用等方面展开了广泛的研究,并与与业界多家企业达成合作。
算法模型、业务场景、计算力、数据资源结合大数据处理技术栈才能形成大数据智能分析应用,与互联网一样,大数据将有20年的发展周期,将孕育很多发展机遇,从2008的萌芽到如今的行业大数据应用需求普遍出现,基本分析应用发展落地阶段,到未来的普及阶段和成熟阶段,大数据趋势明显。其强大的计算能力,已成为推动大数据时代人工智能技术和应用发展的动力,将大数据和人工智能机器学习推上了新一轮发展浪潮。
从谷歌推出的Google Cloud AutoML到开源AutoML系统AutoKeras、Auto-Sklearn、Auto-Weka,一系列的工具化与商业落地应征了AutoML的强大适用性与商业价值。
更多精彩内容请查看“OFweek(第二届)中国人工智能产业大会--AI+机器人论坛”现场直播!