深度学习:未来机器人的进化途径

下次你看到机器人给人递咖啡,问简单的问题,甚至开车,千万不要大惊小怪。

是的,很多所谓的智能或学习机器人仍然只能做简单的事情,它们不能按照人的大脑的方式工作。然而机器学习确实很难,大多数人工智能事实上非常工程化。发现人类与机器人之间的正确的交互方式可能更难。

 

然而,深度学习(当今人工智能研究员的常用手段)可能成为机器人大脑的进化途径。本月早些时候,我参加了 Robotics: Science and Systems会议,对研究机器人技术的数量印象深刻,机器人技术似乎都可以用深度学习技术解决,在过去的几年,深度学习技术因为Google、Facebook 以及Microsoft而出名。

大会几乎涉及机器人智能的所有方面,从使用“Tell Me Dave”的工具来训练机器人助手完成家务,到教机器人选择从点A到点B的最佳路径。研究人员讨论了在自动驾驶车辆上的应用,从分析土壤类型以增加越野车牵引,到学习地理位置的潜在特征(为了在白天、黑夜、下雨或者下雪天识别它们)。

 

 

我最喜欢的一个演讲是关于机器人“ikeabot”的,它专注于组装家具。它的研究人员正在试图找出机器人和人类同事交流的最佳过程。事实证明,这比教机器人了解物体或者如何适应装配过程需要的多得多。例如,机器人如何请求帮助会影响人类同事的工作效率和工作流程,甚至会让他们感觉,他们正在和机器人一起工作,而不仅仅在它旁边。

数据使机器人更聪明。无论何种输入(语音、视觉或某种环境传感器),机器人都依靠数据来做出正确的决定。研究人员为训练人工智能模型和创建算法使用的数据越多越好,他们的机器人就越聪明。

好消息是有很多好的可用数据。坏消息是很难训练这些模型。

基本上,机器学习的研究人员往往需要花费几年的时间来确定属性、特征或重点模型,并编写代码使计算机能够理解这些特征。为了创建一个能够识别椅子的机器人(或算法),需要利用成千上万的图像训练计算机视觉系统,这中间有很多的工作要做。

这是人工智能的新方法(包括深度学习)起作用了。我们已经在许多场合解释过,目前人们在系统方面付出很多努力,这些系统让他们了解所获取的数据的特点。写这些算法和优化这些系统很不容易(这就是为什么深度学习领域的专家享受着顶级的薪酬待遇),但是他们可以帮助消除大量繁琐并费时的手工劳动。

事实上,在机器人技术大会上,Andrew Ng指出深度学习(不仅限于深度神经网络)是吸收和分析大数据的最好方法。Ng作为Coursera的合作创始人出名,在2011年领衔Google Brain项目,并在斯坦福大学教授机器学习。最近,他加入了中国搜索巨头百度,成为其首席科学家。

 

但Ng也了解机器人。事实上,自从2002年加入斯坦福学院,他的大部分研究都集中在将机器学习应用于机器人,让它们行走、飞翔以及看得更清楚。就是这项工作,或者是它的局限性激励他花这么多时间来研究深度学习。

他说:“如果想在机器人技术上取得进展,就必须把所有时间都用在深度学习上。”

Ng发现,深度学习非常善于学习标记的数据集的特征(例如,被正确标记的图片),也很善于无监督学习,即在处理大量的未标记数据的过程中学习。这就是Ng和他的Google Brain同事发表于2012年的著名论文,关于如何区分猫和人脸,同时也在语言理解中取得巨大的进展。

他解释到:“自然地,当我们尝试创建机器人时,这些功能很有用,能使机器人更好的倾听、理解和感知周围的世界。”Ng展示了一个例子,是关于当前斯坦福研究汽车上的AI系统的,它可以实时区分轿车与货车,并且强调了GPU使一些繁重的计算工作可以在相对小型的设备上进行。

 

随着深度学习的重心移向无监督学习,它可能对机器人专家来说更有用。他谈到曾经做过的一个项目,项目的目的是教机器人认识位于斯坦福大学办公室的物体。该项目包括追踪50000个咖啡杯的图像,用来训练机器人的计算机视觉算法。它是很好的研究,并让研究人员受益匪浅,但机器人并不总是非常准确。

Ng解释到:“对于很多应用程序,我们开始耗尽标签数据。”研究人员尝试将训练数据集从50000扩大到几百万来提高精度,Ng说:“世界上真没有那么多的咖啡杯。” 即使有那么多图片,它们大多不会被标记。计算机需要自己学习。

此外,Ng补充到,大多数专家相信人类的大脑仍然是世界上最令人印象深刻的电脑,有着“非常松散灵感”的深度学习技术,在很大程度上以无监督的方式学习。他开玩笑说:“无论你是多好的父母,都不会教孩子认50000个咖啡杯。”