忽闪忽闪的大眼睛、红润的脸颊、咿呀学语的婴儿怎么看都不像是机器学习的终极形态。但是在这样的外表下,一个 18 个月大的机器人可以学习任何形式的人工智能算法。那么他们的秘诀是什么呢?——他们善于观察;他们可以进行模仿;他们还可以进行推算。
人工智能领域的研究人员已经开始注意到了这一点。本周两支独立的研究团队开始涉足认知心理学,并且开发了可以让机器像婴儿一样学习的新型算法:一支团队可以让计算机进行模仿;而另一支团队则可以进行推算。“人类是地球上模仿能力最强的生物,小孩可以不断地进行模仿和创新活动。”华盛顿大学心理学教授 Andrew Meltzoff 博士说。为什么不设计出可以像婴儿一样学习的机器人呢?
婴儿咿呀学习,机器问题不断
为了能够很快地认识这个繁华、甚至是混乱的世界,婴儿通过观察这个世界来进行学习。然后这些分立的信息——例如脸、地点、物体——可以快速转换成概念,并且形成一个灵活的框架,可以让婴儿开始问一些简单的问题。
Brenden Lake 博士告诉《科学杂志》,婴儿的学习效率真的出奇地高。例如,当婴儿开始学习他们的母语的时候,他们通常只需要几个例子就可以获得一些物品的基本概念,例如椅子、梳子或者踏板车等。通过一种方式,他们可以推断出单词的本质,并且获得使用这些单词和对物品进行分类的能力。但是婴儿也不仅仅是观察者。在两岁以前,他们甚至可以问一些更难的问题:“为什么?”这意味着他们已经开始试着理解人们的意图。可以说他们大脑的潜意识里已经开始充满疑问。例如这个人想要做什么?他们如何实现这一点?我是否能通过不同的方法实现同样的目标?通过观察他人,婴儿可以学会一些必要的技能、社会规则和自然法则等。然后他们会将这些概念分类,并且通过新的方法来将这些知识进行重新组合,从而发明出新的结果。
与此相反,即使是高性能的机器学习模型也是机械化的。Lake 说,我们并不会对具体的规则进行编程来教会机器,例如究竟什么是猫。相反,目前最好的办法是为电脑提供成千上万的例子,然后让算法找出最佳解。虽然近年来该领域也有很大的进步,但是对于真实世界中的大多数概念,机器仍然无法理解,尤其在只给出少量例子的情况下。和人类不同,机器意识不到自己究竟学习了什么,即它们无法将学到的知识运用到新的问题上。
让我们回想一下 Segways 第一次面世的时候。我们会对这款产品多看一眼,以便找出其主要特征,但是我们并不会就此止步。你也可以理解车把手是如何与车轮相连接的,并且它们是通过发动机供电的,同时你也可以站到上面去。通过这些知识,你可以勾勒出对 Segway 的理解,或者也可能在你大脑中迸发出一个不同的产品。但是机器不能。这也是 Meltzoff 、Lake 及其团队努力想要解决的问题。
模仿游戏
Meltzoff 与华盛顿大学 Rajesh Rao 教授合作解决了婴儿学习的第一步——观察和模仿。
该团队开发了一种算法,这种算法允许机器人考虑其行为可能产生的不同结果。然后,该机器人可以建立一个概率模型,通过这个模型机器人可以理解人的行为和意图。当不确定的时候,机器人还可以向人类寻求帮助。
该团队通过两个任务来测试了他们的这种算法,这两个测试都是模仿之前 Meltzoff 已经在人类婴儿身上经过测试的实验。在一个实验中,机器人学会了如何能够跟随实验者的眼神——这项任务远比听起来要复杂。机器人需要学习如何运动自己的头部,并且理解人类的头部运动。然后机器人可以追踪人类的头部运动,并且通过人类的眼神来判断他正在看的方向和目标。基于以上观察机器人会完成自己的运动,以使得其眼神也在相同的方向。当 Meltzoff 蒙住实验人员的双眼时,机器人判定这个人再也看不见了,因此不再跟随其眼神。
在第二个实验中,机器人可以用自己的抓手与食物状的玩具一起玩耍。然后它需要模仿人类将玩具推向周围。除了模仿「导师」的一举一动,机器人也发明了自己的方法来完成相同的任务。例如,和推一个玩具相比,对于机器人来说使用抓手将玩具抓起后放到相应位置更方便。但是这样的层次高得令人难以置信,因为机器人需要知道目标究竟是什么,最困难的问题是什么,我们已经解决了什么问题等。
获得概念
和 Meltzoff 不同,Lake 及其同事努力进行机器学习的下一步研究:建立概念,并且进行推断。具体来说,该团队开发了一种新的计算模型,这种模型允许机器通过一些例子获得并且应用大量的新概念。
Lake 说,传统的机器学习算法采用的是一种统计算法——他们将概念视为像素图像或者一些特征。学习问题事实上就是找到相应的图样或者特征。Lake 的算法将概念视为关于这个世界的模型,这一点与婴儿更加类似。通过这种方法,学习就是一个建模的过程。该团队通过一种非常具体的任务来进行测试:他们用组成世界各地语言的手写字符的笔画来进行算法训练,而一些确定的笔画组合结果(通常被视为一个字符)将会被视为一种概念。这种算法可以自动将这些概念编写成程序,从而形成“概率模型”。当研究人员运行这个程序的时候,它可以生成一些虚拟的笔画。例如,一个程序可以通过一系列笔画写一个字母 A,就像人写字那样。接下来,该团队用一些从来没有出现过的字符来挑战这种算法,并且让它来猜如何才能写这个字符,而该算法需要尽力产生一个看起来像这个符号的字符。
在两项任务中,这项算法表现不俗,和人类志愿者的表现一样完美,且优于使用深度学习的人工智能方法。“如果我们想要开发一种不仅可以理解并且可以预测数据的算法,那么我们需要从我们拥有的最好的智能——那就是人类的智慧中去汲取经验。”Lake 说。
两项研究都是通往这个目标的早期研究。Lake 说,我们认识到了提高我们算法的几项关键因素,这也是科学家可以从人类婴儿身上发现的。其中一项因素就是理解因果关系,在我们的例子中这就是书写的过程。另一个因素就是「学习如何学习」,即从之前的相关例子和知识中获得的概念有助于新的概念的学习。
Meltzoff 也同意这种说法。通过模拟人类的发展,他相信机器人通过观察、模仿和推断其他人类或者机器人的行为,将会有能力学习更多复杂的任务。模仿人类的发展过程并不是建立智能机器的唯一办法,甚至可能并不是最好的方法,但是其确实有很大潜力。Meltzoff 认为,通过将人工智能科学家和发展心理学家聚集在一起,或许我们可以将最好的人类学习和最好的机器学习结合在一起,而最终将会使双方受益。