人工智能之机器学习ML

AI优化生活

    我们经常看到这几个热词:人工智能(ArtificialIntelligence)、机器学习(MachineLearning)和深度学习(DeepLearning),但是它们之间究竟有什么区别和联系呢?
    人工智能(AI)的根本在于智能,即如何为机器赋予人的智能,这是一个非常大的范围。
    机器学习(ML是指通过数据训练出能完成一定功能的模型,是实现人工智能的手段之一,也是目前最主流的人工智能实现方法。人工智能是科学,机器学习是让机器变得更加智能的方法或算法。
    深度学习(DL)是机器学习的一个分支。深度即层数,超过 8 层的神经网络模型就叫深度学习。深度学习也是当下最流行的机器学习的一种。目前在语音、图像等领域取得了很好的效果。
    三者之间是从大到小的包含关系。
    
    今天重点介绍一下机器学习ML
    机器学习直接来源于早期的人工智能领域。
    机器学习为什么如此重要?机器学习之所以成为人工智能背后的强劲动力是在于一个重大突破--互联网的发明。互联网有大量的数字信息被生成存储和分析。机器学习算法在这些大数据方面是最有效的。
    
    机器学习最基本的做法,是使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务、硬编码的软件程序不同,机器学习是用大量的数据来训练,通过各种算法从数据中学习如何完成任务。机器学习则是机器通过大数据的输入,从中主动寻求规律,验证规律,最后得出结论,机器据此结论来自主解决问题,如果出现了偏差,会自主纠错。
    
    那么什么是机器学习呢?
    机器学习ML(Machine Learning)是一门人工智能的学科,一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
    机器学习ML是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。
    ML defined byLangley(1996) - Machine learning is a science of the artificial. Thefield's main objects of study are artifacts, specifically algorithms that improvetheir performance with experience.
    ML defined byTom Mitchell (1997)- Machine Learning is the study of computeralgorithms that improve automatically through experience.
    ML defined byAlpaydin(2004) - Machine learning is programming computers to optimize aperformance criterion using example data or past experience.
    机器学习的本质是空间搜索和函数的泛化。无论使用哪种机器学习模型,都要经历要经历“建立模型”,“训练模型”,“反馈”,“应用”的过程。而这个过程,跟一个婴儿认识世界,获取知识的过程是一样的。培养机器建立人的认识的过程,就是“机器学习”。
    
     机器学习常见分类
    1)有监督学习(supervised learning)从给定的训练数据集中学习出一个函数,当新的数据到来时,可以根据这个函数预测结果。主要应用于分类和预测。监督学习的训练集要求是包括输入和输出,也可以说是特征目标。训练集中的目标是由人标注的。常用算法包括人工神经网络(Artificial neural network)、贝叶斯(Bayesian)  、决策树(Decision Tree)和线性分类(Linear classifier)等 。
    2)无监督学习(unsupervised learning)与监督学习相比,训练集没有人为标注的结果。又称归纳性学习(clustering)利用K方式(Kmeans),建立中心(centriole),通过循环和递减运算(iteration&descent)来减小误差,达到分类的目的。常用算法包括人工神经网络(Artificial neural network)、关联规则学习(Association rule learning)、分层聚类 Hierarchical clustering 和异常检测(Anomaly detection) 等 。
    3)半监督学习(semi- supervised learning):介于监督学习与无监督学习之间。结合了大量未标记的数据和少量标签数据。常用算法包括包括生成模型(Generative models)、低密度分离(Low-density separation)和联合训练Co-training等。
    4)强化学习(Reinforcement learning):在这种学习模式下,输入数据作为对模型的反馈,不像监督模型那样,输入数据仅仅是作为一个检查模型对错的方式,在强化学习下,输入数据直接反馈到模型,模型必须对此立刻作出调整。常见的应用场景包括动态系统以及机器人控制等。常见算法包括Q-Learning、时间差学习(Temporal difference learning)和学习自动 Learning Automata等。
    
    机器学习研究内容主要包括三个方面
    (1)面向任务的研究:研究和分析改进一组预定任务的执行性能的学习系统。
    (2)认知模型:研究人类学习过程并进行计算机模拟。
    (3)理论分析:从理论上探索各种可能的学习方法和独立于应用领域的算法。
    机器学习研究领域集中于两个范畴:
    (1)分类任务要求系统依据已知的分类知识对输入的未知模式作分析,以确定输入模式的类属。相应的学习目标就是学习用于分类的准则(如分类规则)。
    (2)问题求解任务要求对于给定的目标状态,寻找一个将当前状态转换为目标状态的动作序列;机器学习在这一领域的研究工作大部分集中于通过学习来获取能提高问题求解效率的知识(如搜索控制知识,启发式知识等)。
    
    机器学习应用广泛,如:计算机视觉自然语言处理生物特征识别、数据挖掘、搜索引擎、自动驾驶、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、专家系统、认知模拟、规划和问题求解、战略游戏和机器人等。
    机器学习各种方法的应用范围不断扩大,一部分已形成商品。归纳学习的知识获取工具已在诊断分类型专家系统中广泛使用。连接学习在声图文识别中占优势。分析学习已用于设计综合型专家系统。遗传算法与强化学习在工程控制中有较好的应用前景。与符号系统耦合的神经网络连接学习将在企业的智能管理与智能机器人运动规划中发挥作用。
    
    机器学习是继专家系统之后人工智能应用的又一重要研究领域,也是人工智能和神经计算的核心研究课题之一。现有的计算机系统和人工智能系统没有什么学习能力,至多也只有非常有限的学习能力,因而不能满足科技和生产提出的新要求。对机器学习的讨论和机器学习研究的进展,必将促使人工智能和整个科学技术的进一步发展
    结语
    机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。机器学习是人工智能的组成部分,是人工智能的核心和前沿。机器学习的进展将不断推动人工智能向前发展。