一文带你读懂深度学习:AI 认识世界的方式如同小孩

科技小导游

    人工智能想要继续发展,也许可以从儿童学习的方法中受益。
    如果你经常花时间和小孩子待在一起的话,你会不由得思考小孩子怎么能够学习得如此之快。哲学家们,比如柏拉图也曾经考虑过这个问题,但是从来没有找到一个满意的答案。我五岁的儿子,奥吉最近认识了植物,动物和钟,当然也少不了恐龙和飞船。他还弄懂了如何理解他人的需要和感受。他可以用知识来定义他看到和听到的东西,并且做出新的预测。比如他最近就说前不久在纽约市美国自然历史博物馆展示的新雷龙是食草动物,所以说并没有那么可怕。
    但其实奥吉体验到的不过是一串光子到达了他的视网膜,他的耳膜接收到了空气的振动而已。他蓝眼睛背后的“神经电脑”从某种角度上来说通过他感知到的有限的信息做出了食草雷龙不是很可怕的预测。那么问题来了,是不是说电脑也可以做到这样呢?
    过去15年的时间里,计算机科学家和心理学家一直在尝试找到一个答案。儿童从老师和家长那有限的输入当中获取了大量的知识。尽管如今机器智能风头正盛,但是最厉害的电脑也不能像一个5岁儿童那样进行学习。
    搞清楚儿童的大脑究竟是如何运转的,然后设计出一个电子版本能够同样有效地运转,可能需要计算机科学家们几十年的努力。但同时,他们已经在开发融合了人类学习模型的人工智能了。
    追根溯源
    在上世纪五六十年代的第一次热潮爆发以后,接下来对AI的探索就沉寂了几十年。不过在过去的几年里,学界突然取得了重大进展,尤其是在机器学习领域。AI一时间变成了最热门的技术。这些进展究竟是拯救人类还是毁灭人类,一时间也众说纷纭。AI在也确实曾被用来预示永生或者世界末日,这两种可能性文学作品里都已经写过很多。
    我觉得在AI领域取得了这些发展引起人们强烈感受的主要原因在于我们内心深处其实非常害怕类人类的出现的。不管是《科学怪人》里的魔偶还是2015年《机械姬》电影里的性感机器人,未来会出现一种“生物”会成为连接人类与人工之间鸿沟的桥梁,这种想法本身就让人觉得恐慌。
    但是计算机真的能像人类那样学习吗?那些席卷媒体的热点新闻,有多少是真正具有革命意义的产品,而又有多少只是噱头而已呢?电脑学习分辨猫,或者一个平片假名的过程很难被人理解。但是仔细观察之后我们会发现,机器学习背后的基础理论并没有一开始看上去的那么难以捉摸。
    但是计算机真的能像人类那样学习吗?那些席卷媒体的热点新闻,有多少是真正具有革命意义的产品,而又有多少只是噱头而已呢?电脑学习分辨猫,或者一个平片假名的过程很难被人理解。但是仔细观察之后我们会发现,机器学习背后的基础理论并没有一开始看上去的那么难以捉摸。
    一种解决办法是我们接收到的光子和空气振动,到了电脑上就会以数字图像的像素和录音的声音片段呈现出来。然后试着从数据中提取一串图案用来探测并识别周围世界的物体。这种自底向上的研究方法在一些哲学家和心理学家的理论中也可以找到,比如约翰·密尔。
    上世纪八十年代,科学家找到了一种令人信服的方式应用这种自底向上的方式让计算机在数据中寻找有价值的图案。”神经网络“系统通过神经元将视网膜上的光图案再现了你周围的环境。神经网络也是一样的图案。通过互相连接的类似生物细胞的处理单元将某一层网络上的像素转换成抽象的表达——比如一个鼻子或一整张脸。
    神经网络的概念由于最近深度学习新技术的出现又重新振兴了。深度学习这种技术是由谷歌,Facebook和其他互联网巨头进行商业落地的。计算机不断增长的能力——比如由摩尔定律体现的计算能力的指数增长,也是这些系统获得成功的一部分原因,大数据集地快速发展也是其中一部分原因。有了更高的处理速度和更多的数据之后,连接系统能够更加高效地学习。
    就像科学家一样,自顶向上的系统形成了抽象广泛的对于世界的假设。这个系统会预测在假设是正确的情况下,数据会呈现出什么样子。同时这个系统也会不断根据这些预测的结果来修改自身的假设。
    尼日利亚、万艾可和垃圾邮件
    自底向上的方式可能是最容易被理解的,我们首先来解释这个。想像一下你试图让计算机从你的收件箱中分辨出重要邮件。你可能注意到垃圾邮件都有某种让人讨厌的特征:收件人列表特别长,源地址来自尼日利亚或巴伐利亚,总是提到一百万美元的奖金或提到伟哥。但是很可能非常有用的邮件看起来也是这样。你不想错过表示你升职或者得了学术奖项的邮件。
    如果你对比大量垃圾邮件和正常邮件之后,你会发现只有垃圾邮件一般会具备以上的讲故事方式——比如,来自尼日利亚的邮件,并承诺有一百万美元的奖金出现了问题。事实上,也许存在更加明显的区分垃圾邮件和正常邮件的方式——比如不太明显的错误拼写和IP地址。如果你能发现这些信息,你就可以准确地过滤掉垃圾邮件了,而且也不用担心你的正常邮件被拦截。
    自底向上的机器学习可以探索出解决这种问题的相关线索。为了达到这一目的,神经网络必须回顾之前的学习过程。神经网络从巨大的数据库中对成百万的样例进行评估,每一个样例标记为垃圾邮件或者正常邮件。然后计算机从一组识别特征中提取出能区分垃圾邮件的特征。
    
    
    1  2  下一页>