当人工智能遇上MATLAB,模型训练简单化


    人工智能在过去两年被谷歌引爆,于是该领域的创业公司如雨后春笋般生长起来,有的做专用芯片,有的做算法,有的做机器人…人工智能到底是什么?是让机器代替人类完成重复的生产线劳动吗?这样理解为免太简单。人工智能绝对不只是让机器完成模仿,从而替代重复性工作,真正的人工智能需要机器经过训练和学习,接近或者超越人类的智能行为。
    人工智能训练模型的时候,数据是最重要的因素,只有通过大数据训练,才能让训练的模型更接近于实际需求。比如,自动驾驶的模型训练,现在基本是靠自动驾驶汽车上路测试收集数据训练模型,路上的汽车只有采集到更多可能的场景,才能确保训练出的模型更接近实际路况。在人工智能训练中一般会遇到两个问题:第一,数据量不够如何训练模型?第二,数据量太大如何快速进行标注?
    MathWorks产品市场经理赵志宏
    迁移学习:通过模型产生数据训练神经网络
    如果没有数据能做人工智能吗?这是很多初创公司的困惑。在笔者的概念里,正常的AI开发流程是,先采集数据,再训练模型。在最近的Matlab大会上,MathWorks产品市场经理赵志宏先生给出了一个不一样的答案,他表示,“数据、输出和模型是整个AI开发流程的一个步骤。如果开发者想做人工智能,又没有太多的数据,可以采用迁移学习的方法。”迁移学习又是什么概念?不防从实际例子来理解。比如:通过人工智能的方式来预测风力发电机的故障,用户不能等到采集到大量故障数据以后再预测,这样不符合设备维护的目标,而是先用Simulink模型建立一个风里发电机的模型,通过校正让这个模型非常接近风力发电机,然后通过该模型产生故障数据,进而训练机器学习或者深度学习的神经网络。
    赵志宏先生表示,“基于模型设计的优势是,它是在真正做出产品之前建好一个模型,这个模型与实际产品非常的接近,不管是从数字计算、行为计算产生的结果与真正的结果都非常接近。很多工程师在设计产品的时候已经把这个模型建好了,在这个模型上加入故障情况就很容易产生故障数据,这比在实际设备上产生的故障要容易很多。因此,可以进行故障预测和维护。”
    通过深度学习对大数据进行标注
    随着传感器的大量采用,数据量进入洪荒时代,给人工智能进行特征标记带来困难,这时候可以采用深度学习进行标记。赵志宏先生解释,“深度学习的特点是不需要人工手动找出特征值,系统可以自动从数据里提取特征值。MATLAB里面有很多自动标记的工具和功能。LiDAR三维点云技术可以对每一点进行标注,把这个点聚类在一起聚成一个目标模型,然后再把目标具体代表的实物辨别出来。有些用户已经采用MATLAB的工具进行了开发,著名的汽车配件公司AUTOLIV就在用这种方式进行自动数据标注。”
    以膨化食品智能检测为例,研究人员可以在用户咬食品的时候提取特征,用咬合声音和咬合力度衡量食品的松脆度,有了这两个特征,还需要开发一个机器学习的分类器,而MATLAB提供了分类学习器。开发者通过这个工具不需要一个一个去试各种分类器的算法,使用MATLAB提供的APP去一次性尝试所有算法。开始运行APP后,用户选好数据和需要训练的分类器,然后进行训练。在训练过程中,用户可以看到每个分类器的整体结果,选择精确度最高的一个,然后进行更多的调查和研究。如果用户没有研究过AI,可以用MATLAB提供的APP进行学习,去尝试所有机器学习的算法。
    在MATLAB里面做深度学习难吗?用赵志宏先生的话说,只需要写5行的MATLAB代码,用户就可以建出一个能够识别食品的网络。笔者已经多年没接触过MATLAB了,所以无从考证,工程师朋友们如果需要可以进行尝试。
    和开源代码如何协作?
    现在市面上的开源非常热,工程师们可以在开源社区快速获得需要的代码,在人工智能领域也有很多开源资源,作为封闭资源的MATLAB和开源代码相比更新速度可能会较慢,而且加上是收费模式,工程师们也担心两者的融合问题。当笔者问到这个问题的时候,赵志宏先生解释,“开源代码背后有很多的开发团队,他们自愿进行开发,我们也有自己的开发团队。我们并不把开源代码和MATLAB定义为竞争关系,实际上我们各有特点和长处,有时候我们是可以与开源代码共用。有一些开源代码可以在MATLAB里面运行或者直接调用,我们在共同为科技进步做贡献。我们虽然是付费软件,但是提供的不仅是工具,还有很多的服务。”
    “当用户使用MATLAB时遇到问题,我们后面有很强的技术支持团队帮用户解决这些问题。另外,我们的工具不仅是针对某一功能产生正确的结果,我们还考虑把这个功能做得非常的容易使用。比如针对AI应用,我们把界面做得非常适合该专业领域,而且兼顾让用户感觉在使用熟悉的MATLAB或者Simulink的界面。这是我们的优势,如果用户在MATLAB或者Simulink中增加新功能,学习门槛不会很高,容易上手设计。除了提供工具,我们还给用户提供了很多便利,这是从开源工具中所得不到的东西。”赵志宏先生补充。