AI的下一个目标,是与人交流
2019年11月下旬,在谢诺夫斯基在北京参加讲座活动之际,我们对这位顶级人工智能学家进行了专访。
特伦斯·谢诺夫斯基
撰文 | 吴非
20世纪80年代,距离人工智能概念的提出已经过去了30年。这时,该领域的主流学者正在“符号主义”的指导下苦苦挣扎。他们试图通过编程实现人工智能,但收效甚微,始终无法解决计算机视觉、语音合成等实际问题。显然,人工智能一直没有找到正确的发展方向。
这时,两位初出茅庐的年轻人——特伦斯·谢诺夫斯基(Terrence Sejnowski)和杰弗里·辛顿(Geoffrey Hinton)——意识到,当前的思路不会带来真正的突破。他们从大脑中获得启发,开始尝试构建神经网络,让人工智能自我学习。
很快,这些挑战权威的“异端”得到了回报。他们发明了一种随机生成神经网络——玻尔兹曼机,并且证明人工智能可以用于解决实际问题。这些突破奠定了人工智能的发展方向,也让人工智能从边缘走向舞台中央。
现在,谢诺夫斯基这位当初挑战权威的年轻人,已经成为全球最声名显赫的人工智能科学家之一。身为美国国家科学院、美国国家工程院、美国国家艺术与科学学院、美国国家发明学院的“四院院士”,被称作“深度学习先驱”的谢诺夫斯基依然站在探索人类智能的最前沿,并作为顾问委员会成员参与了美国“BRAIN”脑计划的方向制定。
在研究之余,谢诺夫斯基也长期致力于科普。就在去年,谢诺夫斯基的新书《深度学习:智能时代的核心驱动力量》出版问世。
2019年11月下旬,在谢诺夫斯基在北京参加讲座活动之际,我们对这位顶级人工智能学家进行了专访。在一个小时的交谈中,谢诺夫斯基以高涨的热情讲述了他亲历的人工智能早期发展历程,以及对人工智能现状与未来的看法。
《环球科学》:上世纪70年代,当你涉足AI领域的研究时,学界的主流思想是“符号主义”,试图通过编程实现人工智能。在这种情况下,你和辛顿为什么会坚持研究在当时无人问津的神经网络?
谢诺夫斯基:对于计算机科学家来说,符号主义是很自然的想法。因为计算机的运算是二进制的,它的逻辑是非0即1。
而我们的直觉是基于以下两点:首先,复杂的现实世界不是“非黑即白”的,存在很多维度。而用二进制的逻辑描述世界,往往会得到错误的结果。
其次,更重要的原因,来自我们对大脑的观察。从对大脑的研究中,我们获得了启发。我们意识到,大脑与计算机的运作方式截然不同:大脑中有大量并行的信息处理,无论是整合信息,还是作出决定,都是基于数据统计产生的可能性,而不是非黑即白的。
因此,我们产生了这样的直觉:我们要寻找的AI架构,应该能体现出大脑中的上述特征。为此,我们从最简单的结构入手。我们最初研究神经网络的目的,只是想探索这样一个问题:利用与大脑类似的构造,计算机可以完成什么任务。于是,作为先驱者,我们开始为人工智能探索新的发展方向。
当时,人工智能的概念已经提出了30年,人们都在符号主义的框架中开展研究,进展很不尽如人意。我很清楚,这些科学家大大低估了问题的难度。我们意识到,我们需要的可扩展构造必须是并行的。如果在某个时刻只能处理一条指令,那么它的低效率一定会成为瓶颈。而如果要做大量并行计算,需要数千亿个神经元,这就是人类大脑中的情形。
当时,AI领域的权威包括麻省理工学院的马文·明斯基(Marvin Minsky)、斯坦福大学的约翰·麦卡锡(John McCarthy),还有卡内基梅隆大学的科学家。他们拥有一切资源,有所有的经费、学生,他们具备了一切,唯独缺少正确的想法。当时我们还很年轻,我们感觉到我们走在正确的方向上。这就是我们所做的。
《环球科学》:神经网络发展的转折点是什么?其他研究者何时开始意识到,神经网络可能是更有效的解决方式?
谢诺夫斯基:在我看来,我们上世纪80年代所做的工作,更多的是一种原理验证。我们证明了,为多层神经网络创建学习逻辑是可行的,而在此之前人们认为这是不可能实现的。这是非常重要的进展。当时的计算机还不足以解决真实世界的问题,所以我们当时的论证,只是使用很小的数据库,做一些类似玩具的演示。
但一个例外是语音合成:输入字符串,输出语音。我们在1986年实现了这个功能,这也是神经网络学习的首个实际应用。在英语中,语音合成是个很难的问题。意外的是,我们构建的神经网络只包含几百个单元,但已经能做得很好了。这些词汇属于符号,但他们(当时的主流AI学者)用符号主义却无法解决任何语言问题。
这个网络的优美之处在于,它提取的是词语间的语义学信息。有些词汇的含义很丰富,这是我们交流的基础。我们将词汇视作底层,它们与其他词汇的关系,携带了特定的含义。这可能是新旧AI系统最大的区别:我们创建的新系统基于非常复杂的深度学习网络中的高维结构,可以通过学习创建。
《环球科学》:在那之后,一些研究者开始将研究方向改变为神经网络?
谢诺夫斯基:是的,但最大的转折点是在2012年,辛顿和他的两个研究生在李飞飞创建的ImageNet图像识别比赛中,运用深度学习大幅提升了图像识别的准确率。这是一次巨大的飞跃,相当于20年的计算机视觉研究。这是通过学习实现的,而不是编程。
因此,这是在不同的框架中,完全不同的思考方式。计算机科学家总是通过编程来解决问题:写下一段代码,这样就得到一个算法。但问题是,在面对计算机视觉或语言等复杂问题时,这种非黑即白的逻辑非常脆弱。
但学习可以带来额外的奖励。奖励是什么?如果你有了数据,你不需要自己理解它,因为算法帮你解决了。它能够按照人类的方式学习。正如你懂汉语,但你不知道你是如何学会汉语的。
这正是我们的意图:学习是AI缺失的一块,它很难被装进简单的程序框架,但却很容易被放进神经网络中,这也正是自然的处理方式。自然界用了数亿年演化出非常高效的策略来解决问题,我们可以从中受益。每个物种都能解决不同的问题,我们需要理解这些。神经科学的研究开启了全新的方向。
《环球科学》:现在,人工智能系统开始在不同的领域发挥作用,例如一些AI检测特定疾病的准确率,可能比人类专家更高。你认为,AI会在某些领域取代人类吗?
谢诺夫斯基:我认为AI与人类不是取代与被取代的关系,它们是两个不同的选项。所有的证据都表明,AI将成为人类的同伴。例如,医生有着丰富的经验,可以从数据中挖掘出更加复杂的事情。而AI的能力范围很窄,只能直接获取数据中的信息。在《深度学习》这本书中,我举了这样一个例子:通过深度学习网络诊断皮肤疾病。对于皮肤科医生来说,诊断皮肤病变是极具挑战性的任务。不同的皮肤病变有超过2000种,医生需要给出诊断,判断病变是良性的,还是有致癌风险的。
一篇发表于《自然》的论文,就用包含了两千种皮肤病变的14万张图像,对深度学习网络进行训练。经过训练的AI系统预测病变的正确率达到92%,这一数字与一组经过专业训练的人类专家持平。这个案例告诉我们,通过海量的数据,我们可以训练AI,用于解决很复杂的问题。但是,无论是AI还是人类,正确率都停留在92%。可以做得更好吗?
于是,他们做了另一项试验:让一组医生使用先前的AI系统协助诊断,这时正确率达到了98%。
《环球科学》:所以,AI可以用作医生的工具。
谢诺夫斯基:完全正确,这时诊断的错误率从8%降至2%,这是巨大的进步。AI可以带来相对独立的信息,这些信息与医生的经验结合,能够提升整体表现。我认为这将是未来的图景:医生不会被取代,他们可以在AI的协助下做得更好。人们喜欢非黑即白的思考方式,但实际上,合作才是解决问题的更有效方式。
《环球科学》:我们知道,你是美国脑计划顾问委员会的一员,可以聊一下你在美国脑计划中的工作吗?
谢诺夫斯基:美国脑计划始于2013年,由奥巴马政府发起。该计划要解决的重要问题之一,是寻找能够有效记录大脑活动的工具。我们的大脑经过数亿年的演化,形成了拥有上千亿个神经元、千万亿神经元连接的复杂结构。根据传统的手段,微电极一次性只能记录少量(例如几百个)神经元的活动,但我们需要了解对象有上千亿个。
作为顾问委员会成员之一,我和其他专家讨论了脑计划的7个主要目标。其中之一,就是能同时记录大量神经元的活动。现在,10年计划已经过了一半,我们已经能够运用光学技术和微电极阵列,一次性监测数万个神经元活动。这为思考大脑的工作方式,提供了全局的视角。我们可以更好地理解神经元如何相互作用、信息如何传递。
为了将我们测得的小范围结果放大到更大的脑区,深度学习需要参与其中。对于神经元和突触的轮廓、不同区域间的连接方式,使用人类已经测出的数据训练,AI可以大幅增加我们重建的神经元数目。现在我们可以重建出包含数十亿个突触,厘米尺度的皮质区域。因此,我们看到了有趣的一幕:我们大脑的智慧创造了AI,AI反过来又帮助我们理解大脑。因此,生物学与算法最终汇聚在一起,相互学习,帮助实现目标。
《环球科学》:一些学者的观点是,将大脑的完整结构模拟出来,就能理解智能。你同意这样的观点吗?
谢诺夫斯基:实际上,这是个很有趣的问题。1968年,悉尼·布伦纳(Sydney Brenner)就已经重建了包含300个神经元的涡虫的脑。但这并不能告诉我们,它们是如何工作的。这就像是线路图,但你必须掌握它的信号,需要记录神经元活动、突触是处于兴奋还是抑制状态。现在,我们能够在提取出“线路图”的同时,记录其中的神经元活动。两者都很重要,现在我们已经两者兼具了。
《环球科学》:除了你正在参与的美国脑计划,其他国家也开展了一些脑科学项目:中国的脑计划刚刚起步;欧盟的人脑计划开展了6年,但遇到一些障碍。可以聊聊你对这些项目的看法吗?
谢诺夫斯基:我是欧盟的人类脑计划的科学顾问,因此我知道这个项目的确遭遇了麻烦。欧盟的人类脑计划更多的是一个计算机科学项目,而不是脑科学本身。这个项目的大量经费并非用于开展脑科学试验,而是用于建造数据库。计算机科学家正在设计这些大型计算系统,其中的芯片拥有大量类似神经元的处理单元。显然,这样的研究具有重要价值,所以我相信欧盟的项目在计算机方面将收获好的结果。美国的脑计划已经非常成功了,它选取了不同的研究方向:开发用于研究大脑的工具与技术。因此可以说,这两个计划是互补的:美国的项目获取数据后,欧盟的可以进行数据分析。
《环球科学》:因此,这些不同的项目聚焦的方向不同,但都将在脑科学这个问题上发挥作用。
谢诺夫斯基:没错,要理解大脑这样复杂的结构,我们需要大量不同的才能。因此我们看到,每个国家的研究方向都有所差异。包括中国,尽管中国的脑科学计划还没有官方宣布,但基本可以确定,中国将重点研究灵长类的脑科学,而AI将在这类研究中扮演重要角色。这也是区别于美国、欧盟脑计划的一点。
《环球科学》:你如何看待AI的未来发展?在你看来,AI的下一个阶段是什么?
谢诺夫斯基:对未来进行预测很困难,未来总是复杂、充满未知的。AI的前30年缺乏牢固的基础,只有很脆弱的符号。他们不知道自己在做什么,没有正确的工具、正确的数学。
我说了,他们缺少牢固的基础。但什么才是“牢固的基础”?我认为是与人的交互,能与人类交流。这可以通过词汇,通过图像来实现。我想,深度学习已经提供了这样的基础,在现实世界与计算机之间成功建立起联系。所以现在,我们可以在这样的基础之上开展研究。
幸运的是,这样的基础是建立在成熟的数学、物理、工程、生物科学的基础上。我们享受着来自数学、物理的所有工具的好处。这将帮助我们在基础之上,建立更加复杂的算法。现在我们面对的是一个非常年轻的领域:深度学习只有不到10年的历史,还需要数十年才能走向成熟。我们有一个很好的起步,但必须缓慢地前进。从原理验证到可靠的实际应用,总是要花费数十年。在此期间,我们需要非常谨慎,因为在创建新事物的过程中,可能会有意料之外的结果。所以我们需要等待,确保这些进展对人类是安全的。
版权申明:本文来源环球科学网,版权归原作者所有。
文章转摘只为学术传播,如涉及侵权问题,请联系我们,我们将及时修改或删除。