乔姆斯基对ChatGPT的尖锐批评:AI到底有多智能

2026-06-05 4906

艾思科蓝官网-版头.gif


640 (10).png

诺姆·乔姆斯基


【导读】美国语言学家乔姆斯基认为,语言习得能力是人类大脑与生俱来的。人工智能(AI)的兴起,尤其是ChatGPT等大语言模型,表明语言可以从统计模式和数据驱动的学习中生成。乔姆斯基指出,大语言模型擅长模仿,但缺乏人类语言所特有的深层认知能力。而在被誉为“人工智能教父”的辛顿眼里,语言学习模型展现出真正的语言能力,乔氏先天语法观点甚至是荒谬的。乔姆斯基与辛顿等人之间的“语言之战”,标志着我们对智能、智慧和自主性的定义进入了一个关键时刻。

【关键词】乔姆斯基  ChatGPT  语言之战


语言学家乔姆斯基(Noam Chomsky)对ChatGPT等大语言模型(Large Language Model,LLM)的批评可谓直击核心,而且火力全开。他认为这些程序虽能模仿人类语言,但本质上只是强大的“模式匹配统计机器”,呈现的是概率而非真相,不具备人类的思考能力,缺乏真正的理解力和创造力。在他看来,人类拥有与生俱来的语言能力,这是我们物种独有的遗传禀赋,可以在少量信息的基础上进行抽象、推理、创新,这是人工智能(AI)依赖海量数据和算力无法复制的。乔姆斯基指出,AI缺乏道德判断和人文主体性,若过度依赖甚至崇拜这类技术,就会在科学与伦理上走偏,甚至危及人类自身。这种观点很能见出人们熟悉的乔姆斯基身影,他不仅仅是著名的语言学家,更是一位通过政治活动树立道德标杆的学者。


乔姆斯基的严厉批评引发了AI领域的强烈反驳。“深度学习之父”辛顿(Geoffrey Hinton)等人认为,大语言模型通过数据训练生成的语言,已经近乎人类的自然语言,直接挑战了乔姆斯基几十年来的语言学理论。这场论争反映出技术与人文之间的张力,折射出对人工智能发展方向的一个深刻的认识论分歧:人工智能的统计近似值,真的能够取代智慧吗?双方争论的焦点从语言本质延伸到技术哲学。在ChatGPT风靡全球的背景下,这场论争提醒我们:在拥抱技术的同时,仍需冷静思考其局限与风险。乔姆斯基数十年来一直致力于捍卫语言的生物学根源。无论人们是否认同他的观点,他在这场论争中的角色,足见他对我们思考人性与交往所具有的深远影响。


乔姆斯基的苹果


2023年3月8日,语言学家、无政府主义者乔姆斯基与罗伯茨(IanRoberts)、瓦图穆尔(Jeffrey Watmull)联名在《纽约时报》上发表文章,题为《ChatGPT的虚假承诺》,原文是Noam Chomsky:The False Promise of ChatGPT。在同年5月3日的一次访谈中,乔姆斯基说瓦图穆尔是这篇文章的作者,他和另一名合作者仅为顾问,并未实际参与写作,但赞同瓦图穆尔的观点。因为原文标题表明“乔姆斯基如是说”,所以这篇引起很大反响的文章一直被视为乔姆斯基鞭挞ChatGPT的力作。


该文起首援引博尔赫斯(Jorge Luis Borges)的观点充满哲理:生活在一个极度危险又充满希望的时代,就是在经历悲剧和喜剧,但这很可能会给人带来启示。对乔姆斯基来说,在我们这个时代,ChatGPT这类程序既给人带来希望,又让人感觉到一种未知的危险:ChatGPT称得上真正的人工智能吗?它能否像人类一样进行概念性思考并得出逻辑结论?如在《ChatGPT的虚假承诺》中说及的一个观念,在5月3日的访谈中,乔姆斯基再次强调指出,大语言模型不可能从根本上达到人类的语言能力,它们的设计使其无法像人那样区分“可能”的和“不可能”的语言,从而无法满足人类语言能力的最低要求。由于设计上的缺陷,未来的进一步创新也很难奏效。


早在2022年11月YouTube组织的一次互联网高端对话中,乔姆斯基试图“揭穿AI的弥天大谎”,他开场便说,一个系统的可能缺陷有两种:要么是它不够强大,无法完成某些任务;要么是它太强大,会做一些不该做的事情。有人发现了ChatGPT中的许多缺陷,无法实现某些功能。这个问题应该说是可以解决的:再增加一万亿个参数,也许会做得更好。而过于强大的系统通常是无法修复的,这正是ChatGPT和其他类似系统的问题所在。他举例说:假如你给ChatGPT的数据库提供一种违反语言规则的语言,它照样能做得很好,常常会更好,因为规则更简单,它可顾不上人们实际上是怎么说的。一个系统对不可能语言和可能语言同样有效,就不会告诉我们任何有关语言的信息。


人类智能和人工智能之间存在的差异几乎是本质性的。在《ChatGPT的虚假承诺》一文中,乔姆斯基以揶揄的口吻描述了当下的情形:OpenAI的ChatGPT、谷歌的Bard和微软的Sydney,都是机器学习的奇迹。它们摄取大量数据,从中寻找模式,越来越擅长输出看似人类的语言和思维。人们欢呼人工智能的地平线上出现了第一缕曙光,仿佛越来越接近人们期待已久的时刻:机器大脑不仅在处理速度和内存容量方面超过了人脑,而且在洞察力、艺术创造力和其他所有人类才有的能力方面也取得了决定性胜利。然而,目前的大语言模型仅在操纵统计模式,不能真正理解语言。


但乔姆斯基的严厉判断是:“虽然这些程序在某些狭窄的领域可能很有用(例如在计算机编程方面,或者为轻快的诗歌提供押韵建议),但从语言学和知识哲学的角度来看,它们与人类理性和使用语言的方式有着巨大差异。这些差异极大地限制了这些程序的功能,并导致无法消除的缺陷。”AI系统乃至类人机器人目前只能模仿,还无法如人类一样“梦想世界”。ChatGPT生成的图像、诗歌或文章,仍然是人类能力的复制品,尽管可能令人印象深刻,但说到底只是披着聪明外衣的高仿“假肢”,远远谈不上真正的智能。


乔姆斯基援引威廉·封·洪堡的观点来解释人类心智:人类大脑通过语言,可以“无限地运用有限的手段”,创造出具有普遍意义的思想和理论。乔姆斯基认为,人类思维与人工智能领域的发展完全不同,这是因为人类大脑不是一台笨重的模式匹配统计机器,而AI“吞噬了数百兆数据,推断出最有可能的对话响应,或者最有可能的科学答案”。对于这位时年94岁的老人来说,情况恰恰相反:“人类大脑是一个极为高效而讲究的系统,只需要少量的信息就能运作;它寻求的不是推导出数据点之间的粗暴关联,而是创造解释。”在乔氏眼中,创造力是人类与ChatGPT之间的最大鸿沟。


机器学习程序的关键是描述和预测,而人类思维包含解释。乔姆斯基用一个经典的例子来说明这种区别:“假设你拿着一个苹果。现在你放开苹果。你看到结果并说:‘苹果掉下来了。’这是描述。预测可能是这样的:‘如果我张开手,苹果就会掉下来。’二者都很有价值,而且都可能是正确的。但解释不止于此:它不仅包括描述和预测,还包括其他猜想,如‘任何这样的物体都会下落’,再加上‘由于引力’或‘由于时空曲率’等说明。这是因果解释:‘如果没有引力,苹果就不会掉下来。’这就是思考。”而机器很难做出类比,解释是人类的思维习惯。


乔姆斯基认为,人类拥有掌握语言的生物本能,这是一个显而易见的事实。“例如,一个幼儿在学习语言时,会无意识地、自动地、快速地从细微的信息中发展出一种语法。”这种语法是天生的、基因植入的“操作系统”,并赋予人类组织复杂句子和大段思考的能力。他又在5月3日的访谈中说到“语言习得”(language acquisition):近年有大量围绕语言习得的极具启发性的研究,表明婴儿对其生长环境中的语言(或多种语言)的了解非常丰富,远远超出他们在实际运用中的表现;并且儿童语言能力的稳定状态很早就出现了,在三到四岁的时候,进而形成语言知识。


在ChatGPT受到热捧的今天,乔姆斯基为何不为之叫好,反而激烈批评大语言模型?到底是哪里出了问题?乔姆斯基在《ChatGPT的虚假承诺》中说:“机器学习这种最流行、最时髦的人工智能,会给我们的技术注入一种存在根本缺陷的语言和知识概念,进而贬低我们的科学和伦理。”他担心的是,高估AI并将其置于人类思维之上,将会给科学和伦理带来可怕的后果。他把聊天机器人视为一种炒作,因为它们根本无法跟上人类的语言能力。赞同乔氏观点的人还真不少,这在YouTube视频分享平台观看乔氏演讲的大量观众留言中可以见出。他们认为当代AI炒作是一个骗局,主要是为了赚钱。


在5月3日的访谈中,乔姆斯基直言症结所在:“在资本主义社会中,企业的目标是营利,而不是人类福祉。制度决定了‘游戏规则’:谁不参与,谁就出局,参与者取而代之。”就这样,“它正在引导我们走上摧毁地球上有序生活的道路”。显然,对乔姆斯基来说,若是ChatGPT和类似程序继续主导AI领域,那么博尔赫斯所说的“启示”压根儿就不会发生,ChatGPT的承诺也将以悲剧告终。不难理解,乔姆斯基为何援引维特根斯坦的观点,提出诸如“潜艇能游泳吗?”“玩偶有灵魂吗?”之类的问题。“思考”或“理解”之类的词语,模仿了人类的能力,但机器本身并不具备这些能力。它们就像黑箱,只能优化相关性,却无法提供因果洞察。


针尖对麦芒


《当代语言学》2024年第4期刊载了陈国华译《杰弗里·辛顿接受尤利西斯奖章时发表的获奖感言》,辛顿被誉为“深度学习之父”,甚至被誉为“人工智能教父”,他在都柏林大学的这一获奖演讲发生在2024年4月8日。自2022年底ChatGPT爆火之后,辛顿多次在演讲中严词批判乔氏的语言观。这次他又看到了一个极佳机会,便毫不客气地将乔姆斯基数落一番。他在获奖感言中说:


语言学家被一个叫乔姆斯基的人误导了好几代。……他有一个偏执古怪的理论,即语言不是学会的。他成功地说服很多人相信这一点。这个说法显然是一派胡言。语言显然是学会的。大型神经网络学习语言,不需要任何先天结构,只是从随机权重和大量数据中开始学习。乔姆斯基却仍然在说,这并非真正的语言,这不算数,这是不对的。许多统计学家和认知科学家也说,永远不可能在这样一个大网络里学习语言。


同年10月8日,辛顿和霍普菲尔德(John Hopfield)以“通过人工神经网络实现机器学习的基础性发现和发明”,获得诺贝尔物理学奖。大语言模型问世不久,两位人工智能科学家就获得诺奖,可见人工智能在颁奖者心目中的重要地位。这也为大语言模型与语言学发展的话题,尤其是辛顿和乔姆斯基之争推波助澜,而且火药味儿十足,人称“语言之战”(language war)。


“先天语言能力”(Innate Language Faculty,ILF)从来被视为乔姆斯基的伟大发现,他认为儿童的这种语言能力具有无穷的创造力,能够从一个结构生成无数语句,拥有无数可能的组合形式。辛顿则认为,现代神经网络模型提供了一个反例,表明只要有适当的机制,数据驱动的学习就足以满足语言习得的需求。因此,以辛顿为代表的AI领域的科学家认为,乔氏语言学信念已经过时,这导致对乔氏语言学理论的质疑声浪明显高涨。他们找到一种用大语言模型开发人工神经网络系统的方法,通过“喂”给系统海量的真实语言数据,训练系统获得生成合乎语法的语句的能力。机器学习程序没有先天语言能力,却能输出有效的表达,而且能够与人类持续对话。于是乎,基于大规模语料统计的语言技术的凯旋,被不少人看作乔氏语言天生理论的失效。对此,乔姆斯基最有资格说点什么。


果然,乔姆斯基在ChatGPT推出一个多月后率先发难。2023年1月20日,他在接受采访时尖锐地斥责了这种新的技术:尽管ChatGPT能够产出非常接近人类的语言,但它依靠强大算力获取材料的手段,“本质上是一种高科技剽窃”;“这些系统在理解语言或认知方面没有任何价值”,它们如同统计学领域的鹦鹉,模仿语言却不理解其规则或起源。随后就是乔姆斯基等人在《纽约时报》上发表的那篇产生很大影响的檄文。在那些反对乔姆斯基观点的人看来,他只是在发泄私愤,如量子计算学者阿伦森(Scott Aaronson)次日(2023年3月9日)即在自己的博客中发表回击文章《乔姆斯基主义的虚假承诺》:“乔姆斯基和他的追随者就像耶稣会天文学家一样,拒绝往伽利略的望远镜里看一眼,说到底是他们对现实本身感到恼火,因为那是出乎他们意料的、不符合他们世界观的东西。”此话出自阿伦森之口并不让人感到意外,因为他已经加盟研发ChatGPT的OpenAI公司。双方的观点可谓针尖对麦芒。


辛顿及其同道确实已经飘飘然,他们好像也有足够的底气指责乔姆斯基,因为他们在经验上很成功。可不,他们做到了乔姆斯基和所有语言学家迄今没能做到的一件事,就是让机器能够产出几乎如同人类自然语言的话语;大语言模型无须先天语法,却能够生成连贯的、与语境相关的文本,其效果足以与人类的表达媲美。这种非常数学化的语言建模的巨大成功和主导地位,活生生地证实了自然语言处理领域的先驱耶利内克(Frederick Jelinek)常被引用的一句名言:“每当我解雇一名语言学家,语言识别器的性能就会提高。”据说他在1985年的一次科学研讨会上说过类似的话,确切措辞已不为人知,但“维基百科”上有一段关于这个说法的有趣的讨论。


也是在2023年3月,加州大学伯克利分校的神经心理学家皮安塔多西(Steven Piantadosi)发表重磅文章《现代语言模型颠覆了乔姆斯基的语言观》,该文被不少人视为对乔氏语言学理论的宣战书。作者得出了极具震撼力的结论:现代机器学习几乎违背乔氏生成式语言学理论所推崇的所有原则,从而颠覆了乔氏语言学方法的整个理论框架和核心主张。大型语言模型绕过了语言天生性之说,在发现语法方面取得了显著成就,无需使用语言学界一些人坚信的对语言科学发展必不可少的任何方法。皮安塔多西认为,乔氏生成语法(Generative Grammar)已不再具有研究价值,大语言模型有足够的理由取代生成语法的理论地位。


以ChatGPT为代表的大语言模型的问世,令不少人欢欣鼓舞;它们在应用方面的极大成功,引发了语言官能是否为人类独有问题的热议。尤其是辛顿获得尤利西斯奖与诺贝尔奖后对乔姆斯基直言不讳地严厉批评,又在更多学术领域和更大范围内激发了人们的讨论热情。国际学界很快形成两个对立的阵营。本来,乔姆斯基从事的是“语言科学”,他探索的是人类习得语言的机制;而辛顿做的是语言技术,也就是技术层面的东西。他们对学习语言的理解完全不一样,看似可以各走各的道。然而,这里涉及语言的本质及其与机器学习和人工智能的关系,这便导致两条路线的斗争。


AI能否意识到自己是“人工的”


AI技术正在风靡全球,正在改变人类生活的方方面面,同时引发了人们对社会和人类未来等重大伦理问题的讨论。在《ChatGPT的虚假承诺》中,乔姆斯基还说到当代AI缺乏人类拥有的道德能力。不具备道德能力,会降低AI机器人对人类的威胁吗?或是更有威胁?对于这个问题,乔姆斯基在5月3日的访谈中说:如果不严格控制,AI工程无疑会带来严重威胁。他举例说:在对病人的护理中,人的判断可以解决突发的问题;假设护理自动化了,则可能产生可怕的后果。他又假设导弹防御系统未来实现全面自动化,不再依赖人对威胁的判断,那将是人类文明的终结。因此,他警示人们:切勿将类人特质赋予机器。


说到人工智能,我们无法忘记物理学家霍金(Stephen Hawking)。2015年,霍金、马斯克(Elon Musk)和其他一些AI专家签署了一封公开信,敦促人们不要忽视不受控制的超级智能所带来的危险。这也是人工智能哲学和伦理学能够成为目前发展最快的研究课题之一的重要原因。霍金在去世前不久还警告说,人类越来越依赖AI和机器人,使自己成为这个世界上的零余者,这是在毁灭人类。人们可以为新的技术欢呼,但不应忘记AI的目的是为人类服务,而不是危害人类。


乔姆斯基与ChatGPT之争,或者辛顿与乔姆斯基之争,表面上是关于语言是否具有内在语法结构的论争。但乔姆斯基也是哲学家,想得更多更远,他更关注的是受到挑战的人类主权,他的批评带着忧思。他看到的是ChatGPT这类程序因缺失人文主体性而出现的道德冷漠。算法无法识别道德问题并提出解决办法。它们功利、高效、精准,信息处理极其迅速,但AI本身不具备思考能力。再困难的问题,它也能很快找到“正确答案”,可惜无法告诉我们如何才能过上美好、正确的生活。


如果AI可以帮助医生诊断癌症,这是有意义的,是件好事。如果AI可以帮助预测气候变化,并告诉人们如何应对,这也是有意义的,也是件好事。但在大语言模型的成功光芒下,我们能听到一种声音:为什么要开发具有人类形态和所有人类能力的人工智能呢?AI能否意识到自己是“人工的”?这或许只是一场有趣的游戏,但到头来很可能还是一场危险的游戏。难怪乔姆斯基在《ChatGPT的虚假承诺》中要引用博尔赫斯的话说:“如此多的金钱和精力都集中在这件小事上,这既是喜剧,也是悲剧。与人类思维相比,这太微不足道了。”


乔姆斯基认为(2023年5月3日访谈),语言能力是人类特有的物种属性,为人类群体所共有,从根本上说是人类独有的属性。人类智能与人工智能有什么区别呢?我们可以从幼儿如何学习语言说起:你指着一只猫说“猫”,从此,见过几次猫的孩子便知道未来的猫都是这样的,并重复使用这个词。一台机器则需要数百甚至数千张猫的照片,而且是各种姿态的:从下看、从上看、从侧面看、跳跃、睡觉、蜷缩起来、在桌子下、在桌子上,等等。只有猫在所有情况下都是这只猫的时候,机器才能说:“哦,是的,猫!”机器的学习方式与我们的截然不同,人类有抽象思考能力:一朝猫,永远是猫。当然,机器要快得多:如果让计算机对百万条数据进行排序,并向我们展示所有猫的图片,它用五分钟就完成了;让人看的话,需要几天时间。但关键问题是,机器识别出猫,它真的懂得这是猫吗?显然不懂。而我们人类不仅见过很多猫,而且还摸过、抱过,喜欢过或讨厌过,跟猫在一起有故事,这才有意义。


乔姆斯基认识到机器学习和人类思维的根本区别。他在一次互联网峰会做客时说:“大脑比机器更有效率。”我们还可以举一个例子:为了识别苹果,机器必须首先检查成千上万张苹果照片,而小孩只看过几个标本就能认出苹果。另外,同样是一个苹果,让机器确定它能保存多久是很困难的,而人有触觉,可以触摸苹果,发现侧面有点软,知道它开始发酵了。当然,人还能闻到水果的味道。要做到这一切,一台机器拥有的信息量还太少,它甚至不一定总有能力区分苹果和橙子。当然,目前正在研发的多模态大模型,有朝一日或许能解决这里所说的问题,只需增加足够的对应类型的传感器就可以了。但按照乔姆斯基的意思,这么费劲值得吗?最后回到这场“语言之战”的背景:乔姆斯基年事已高,人工智能的发展日新月异。无论如何,整个分歧远不止学术层面,还包含更广泛的反思。


原刊于《中国图书评论》2026年05期“社会关注”栏目。


艾思科蓝官网-版尾.jpg

会议官网

扫码关注艾思科蓝订阅号 回复“0”即可领取该资料

去登录