黄宜华教授:大数据时代下机器学习的革新
人工智能历史由来已久,早在1308年,加泰罗尼亚诗人兼神学家者雷蒙·卢尔(Ramon Llull)出版《The Ultimate General Art》,详细描述了其“逻辑机”的概念,这便是最早人工智能理念的诞生。随着时代发展,如今的人工智能早已发生了翻天覆地的变化,以前的机器只关注算法本身,如今进入到大数据时代,一切都将发生变化。
黄宜华(中国计算机学会大数据专家委员会常务委员、副秘书长)
11月13至14日,由OFweek中国高科技行业门户主办,OFweek人工智能网承办的“OFweek2017中国人工智能大会”在深圳举办。中国计算机学会大数据专家委员会常务委员、副秘书长黄宜华教授在《大数据机器学习---从算法到系统》主题演讲中,重点分析了目前机器该如何在大数据之下进行学习。
大数据下的机器学习
首先,黄宜华教授对于大数据定义做了简单介绍。他认为,一般意义上大数据是指无法在可容忍的时间内用传统IT技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。
近几年,大数据逐渐成为学术界和产业界的热点,已在很多技术和行业内广泛应用。从大规模数据库到商业智能和数据挖掘应用、从搜索引擎到推荐系统、以及最新的语音识别、翻译等。大数据算法的设计、分析和工程涉及很多方面,包括大规模并行计算、流算法、云技术等。由于大数据存在复杂、高维、多变等特性,如何从真实、凌乱、无模式和复杂的大数据中挖掘出人类感兴趣的知识,迫切需要更深刻的机器学习理论进行指导。
大数据强大的计算能力,已成为推动大数据时代人工智能技术和应用发展的动力,将大数据机器学习和人工智能推上了新一轮发展浪潮。大数据隐含着很多深度知识和价值,大数据智能化分析挖掘可为行业/企业带来巨大的商业价值。大数据的深度价值发现需要使用基于机器学习的智能化复杂分析才能完成,机器学习和数据挖掘已成为将大数据转换成有用知识的关键技术。传统计算时代,仅仅关注机器学习算法本身,而大数据时代的机器学习,已经不仅仅是一个算法问题,更是一个完整的大数据学习系统问题。
大数据学习系统未来发展趋势
要实现高效的大数据机器学习,需要构建一个能同时支持机器学习算法设计和大规模数据处理的一体化大数据机器学习系统。研究设计高效、可扩展且易于使用的大数据机器学习系统面临诸多技术挑战。近年来,大数据浪潮的兴起,推动了大数据机器学习的迅猛发展,使大数据机器学习系统成为大数据领域的一个热点研究问题。
随后,黄宜华教授还具体介绍了国内外大数据机器学习系统的基本概念、基本研究问题、技术特征、系统分类以及典型系统。
在整个机器学习的发展历程中,主要有两大研究方向。一是研究学习机制,注重探索、模拟人的学习机制;二是研究如何有效利用信息,注重从巨量数据中获取隐藏的、有效的、可理解的知识。学习机制的研究是机器学习产生的源泉,但随着大数据时代各行业对数据分析需求的持续增加,通过机器学习高效地获取知识,已逐渐成为当今机器学习技术发展的主要推动力。
最后,黄宜华教授具体解释道,大数据时代的机器学习更强调“学习本身是手段”,机器学习成为一种支持技术和服务技术,如何基于机器学习对复杂多样的数据进行深层次的分析,更高效地利用信息成为当前机器学习研究的主要方向。机器学习越来越朝着智能数据分析的方向发展,并已成为智能数据分析技术的一个重要源泉。另外,在大数据时代,随着数据产生速度的持续加快,数据的体量有了前所未有的增长,而需要分析的新的数据种类也在不断涌现,如文本的理解、文本情感的分析、图像的检索和理解、图形和网络数据的分析等,机器学习研究领域涌现了很多新的研究方向,很多新的机器学习方法被提出并得到了广泛应用。
更多详细内容,敬请关注OFweek人工智能网后续专题报道!