“我必须这么做”:世界最杰出的人工智能科学家之一为何离开美国前往中国
在朱松纯(Song-Chun Zhu)六岁的时候,他已经遇见过的死亡次数多得数不清——至少他觉得是这样。那是20世纪70年代初,他的父亲在中国农村开了一家村供销社。除了种地之外,几乎没什么可做的,于是那家小店就成了人们休息、恢复精力和分享故事的避风港。朱在那家店里长大,吸收了一辈子的悲剧:朋友死于车祸,亲戚因病去世,自杀的故事比比皆是。“那真的很难熬,”朱最近回忆说。“那时人们太穷了。”
朱松纯于北京大学,2025 年 7 月。摄影:Sean Gallagher/卫报
年轻的朱开始对人死后留下的东西着迷。有一天,他发现了一本记载家族谱系的书。当他问管家谱的人为什么里面只有祖先的生卒日期,却没有他们的生活经历时,那人平淡地回答说,他们是农民,没有什么值得记录的。这个答案让朱感到恐惧。他立下决心,自己的人生不能是这样的命运。
如今,56岁的朱已是世界人工智能领域的顶尖权威之一。1992年,他离开中国赴美国哈佛大学攻读计算机科学博士。后来,在加州大学洛杉矶分校,他领导了全球最活跃的人工智能研究中心之一,赢得了无数重要奖项,并吸引到五角大楼和美国国家科学基金会的重量级科研资助。他因开创性研究——探索机器如何在数据中发现模式——而受到赞誉,这项工作为现代人工智能系统(如ChatGPT和DeepSeek)奠定了基础。他和妻子、两个在美国出生的女儿住在洛杉矶穆赫兰大道上的山顶住宅。他曾以为自己永远不会离开。
但在2020年8月,在美国生活了28年之后,朱突然让同事和朋友们大为震惊——他回到中国,出任北京两所顶尖大学的教授,并担任北京一家人工智能研究机构的主任。
朱从中国农村到执掌美国领先的人工智能实验室的旅程,既不可思议,又是更大故事的一部分。近一个世纪以来,世界上最聪明的科学头脑被美国所吸引,因为在那里他们最能推动自己的研究。这些新来者的工作帮助美国在核武器、半导体和人工智能等技术领域建立起主导地位。而如今,这个时代似乎正在走向终结。唐纳德·特朗普正在拆解那些曾经让美国对国际人才充满吸引力的社会要素。他切断科研资金,试图打压顶尖大学——在他政府看来,那些大学是敌对机构。在美的中国学生和教授面临更多压力。回响起20世纪50年代的“红色恐慌”,一些中国学生和教授被拘押、驱逐,签证被吊销。
即便在特朗普政府围攻美国科学根基的同时,它也在大肆宣扬要在人工智能领域战胜中国竞争对手。7月,特朗普宣布在宾夕法尼亚州建立一个价值900亿美元的“人工智能中心”,并与硅谷科技领袖密切合作,制定了一份国家蓝图,力图在全球人工智能的各个方面——从基础设施到治理——占据主导。“美国是开启人工智能竞赛的国家,”特朗普说。“我今天要宣布,美国将赢得这场竞赛。”一个月后,中国也公布了自己的蓝图,誓言要将人工智能融入经济,从工厂自动化到养老服务。
在经费充裕的北京通用人工智能研究院,朱是少数几个被委以推进人工智能前沿重任的人之一。他的理念如今正在影响本科课程设计和政策制定。但他的哲学与美国的主流范式截然不同。美国公司如OpenAI、Meta和Anthropic,集体投资了数十亿美元,建立在这样一个前提上:只要有足够的数据和计算能力,基于神经网络(模仿大脑神经元的数学系统)构建的模型就能引领人类走向通用人工智能(AGI)的圣杯。广义上讲,AGI是指能够完成不限于某一狭窄任务,而是能完成任何任务,其水平可与最聪明的人类媲美甚至超越的系统。科技界的一些人还将AGI视为一个转折点——届时机器将能够自我无限改进。他们相信,依赖神经网络的大型语言模型,距离“起飞”可能只剩五到十年。
朱坚称,这些想法是建立在沙滩上的。他认为,真正智慧的标志是能够以最少的输入推理并实现目标——他称之为“小数据,大任务”的方法,而不是像ChatGPT等大型语言模型所用的“大数据,小任务”方法。朱的团队最近指出,AGI的特征包括在新情境下的机智、社会和物理直觉、以及因果关系的理解。朱认为,大型语言模型永远无法达到这一点。美国的一些人工智能专家同样对硅谷的主流信条提出质疑,而随着人工智能的进展放缓、新的产品(如GPT-5)令人失望,他们的声音今年更为响亮。需要一条不同的道路,而这正是朱在北京努力探索的方向。
在当前的人工智能竞赛中,要把纯粹的学术探索与地缘问题分开几乎是不可能的。研究人员选择在哪里开展工作,已成为一件赌注极高的事情。然而,对某些科学家来说,智力探索的激情——以及个人荣誉的前景——或许依然比国家利益更有吸引力。朱在哈佛时期的同学、20年老友马克·尼茨伯格(Mark Nitzberg),对朱突然回国感到意外。“我问他:‘你确定要这样做吗?’”尼茨伯格告诉我。尼茨伯格回忆,朱的回答是:“他们给了我在美国永远得不到的资源。如果我想要建造我脑海中的这个系统,那这是千载难逢的机会。我必须去做。”
几乎所有在西方认识朱松纯的人都问过我同一个问题:你去过他的办公室吗?它位于北京大学校园北侧未名湖后方,仿佛是为了吸引游客而建。一道格子木门标志着入口,之后你会被带进一个四合院住宅,朱松纯在那里讲课和举办研讨会。在那里,他的助手会带你到大厅的尽头,那里有一扇后门,通往一片令人叹为观止的景观:岩石、溪流和石榴树。溪流对岸还有另一处四合院住宅,它建在一座独立的小岛上,可以通过一座石桥到达。那就是朱松纯的“办公室”。
一个春天的早晨,我去拜访朱先生的时候,他一边欣赏着自己种的花草,一边抱怨着前一天的一场雨把小溪弄得浑浊不堪。我问他是谁在维护这片庭院。“我们有一整支队伍,”他指着一群刚进院子的人说。在朱先生办公室的对面,小溪的另一边,是一间玻璃幕墙的会议室,他在这里接待来访者。我们坐在那里,听朱先生讲述他横跨两个超级大国的一生。
1969年,朱出生在长江边的古老河港鄂州附近,是家中五个孩子中最小的一个。夜晚,在烛光和煤油灯下,教师、牧师和大学毕业生们常常聚集在朱父亲工作的供销社附近举办沙龙。朱听他们辩论,从苏联日益加深的阿富汗局势,到美国大选,无所不包。朱对我说:“等我上小学时,我觉得自己已经对中国和世界正在发生的事情有了很好的理解。”他很清楚自己不想留在家乡父亲的店里工作。
朱松纯是当地高中的尖子生,后来考入位于安徽的中国科技大学,主修计算机科学。1986年,朱松纯开始攻读学位时,中美关系已恢复正常,他的一些教授首批受国家公派访美。他们带回了大量书籍,准备翻译。“当时,我们把美国视为一座灯塔,一座科学的圣殿,”朱松纯说。
进口书籍中包括英国神经科学家大卫·马尔的《视觉》(Vision)。马尔的著作将人类视觉——一个生物过程——分解成数学框架,堪称经典。马尔的著作表明,机器或许有一天能够像人类一样“看”世界。朱松纯对此着迷不已。从那时起,他就梦想着能够绘制智能图谱——我们如何思考、推理和进行道德判断——如同物理学家绘制宇宙图谱般精准。对他来说,构建通用人工智能并非最终目标,而是他更深层次追求的一部分:为心灵发现“万物理论”。
据悉,朱松纯近年来曾两次公开落泪。第一次是在向学生讲述他被哈佛大学录取的故事时。1991年,朱松纯从中国科学技术大学毕业时,家境贫寒,无力支付美国大学的申请费。但他还是申请了,没有支付任何费用,尽管他没有申请美国最顶尖的大学——他不敢。不管怎样,他被拒绝了。第二年,一位教授建议朱松纯再次申请,说常春藤盟校资金更雄厚,可能不会在意那笔漏交的申请费。几个月后,他惊讶地收到哈佛大学寄来的一封厚厚的黄色信封,信中他得知,哈佛大学将全额资助他攻读计算机科学博士学位。“这改变了我的一生,”朱松纯说。
2025年7月10日,朱松纯在北京大学办公室外的花园里。摄影:Sean Gallagher/《卫报》
做出录取决定的人是大卫·芒福德,一位获奖无数的数学家和菲尔兹奖得主。几年前,他开始研究计算机视觉——人工智能的一个领域,专注于让机器能够识别和处理视觉信息。当芒福德遇到一位来自中国中部的申请者,这位申请者提出了一个关于智能的“万物理论”,并把马尔(Marr)视为自己的灵感来源时,他被深深吸引了。“我对他的视野以及他以如此全面的方式来研究人工智能的方法感到震惊,”芒福德对我说。在2020年的一次采访中,芒福德——后来成为朱的导师——提到他意识到自己“遇到了一件特别的事情”的那一刻。朱参加了一小时的考试,但留了一道题空白。不是因为太难,而是因为太简单。“他说,‘这太荒唐了,’”芒福德回忆道,“但其他问题他都答得完美无缺。”
在我们整个春天的谈话中,朱似乎把哈佛与他少年时梦想中的美国联系在一起:一个开放的实验室,一个来自中国农村的乡下孩子,只要有足够的闯劲,就能把科技奇迹变成现实。这是爱迪生和爱因斯坦的美国,是那个欢迎犹太物理学家逃离希特勒德国、并为他们提供庇护、尊严和洛斯阿拉莫斯实验室的国度。在朱看来,这是一个把智慧和雄心置于种族、意识形态和国籍之上的国家。在哈佛,他从未觉得格格不入,尽管有时对新环境感到困惑。有一次,他问同学尼茨伯格,为什么没有人去采摘哈佛校园里树上的苹果。他觉得那是浪费食物。
直到1997年,朱才在美国真正经历了文化冲击。在哈佛完成博士学位并在布朗大学短暂任职后,他来到斯坦福任讲师。他的妻子珍妮也随行,她是朱在中国科大时的同学,两人在1994年结婚。当时的湾区正充满着互联网泡沫的兴奋气氛。雅虎刚刚在华尔街上市,风险投资人云集校园。朱所在系的两位博士生,拉里·佩奇和谢尔盖·布林,刚刚创造了一个名为 google.com 的搜索引擎。随着学生们蜂拥而至学习网络开发课程,朱开设的更偏理论的模式识别课程却难以吸引兴趣。这让他感到沮丧。“在哈佛,大家关心的是理解。他们的校徽是三本书,”他对我说。但斯坦福的校徽——一棵树后面一个“S”——在他看来,“就像一个美元符号”。
朱在斯坦福待了一年后转到俄亥俄州立大学,在那里他觉得文化缺乏雄心、过于地方化。2002年他又来到加州大学洛杉矶分校,在33岁时获得终身教职。同年,珍妮生下了他们的二女儿朱易。一年后,他获得了计算机视觉领域的最高奖——马尔奖。同事们把他比作史蒂夫·乔布斯,因为他的强烈激情和对平庸的零容忍。当我问起他在加州大学洛杉矶分校的一位合作者与朱共事是什么感觉时,他说:“感觉就像我身处前线的战场。我们不会端着一杯咖啡坐下来聊生活或家庭。这种事从来没有发生过。永远只是工作和研究。”
在朱在加州大学洛杉矶分校的18年间,他所处的领域经历了几乎难以想象的变化。在这段时期的大约前半段,他是人工智能主流中的领军人物。然而在后半段,他却日益感到幻灭。与不同的人交谈,他们会提出不同的理论来解释朱为何最终决定离开美国,但几乎毫无疑问的是,至少在某种程度上,他受到了与自己曾经帮助塑造的领域产生智识疏离感的影响。
朱与所谓“人工智能教父”——Geoffrey Hinton、Yoshua Bengio 和 Yann LeCun 等人——的关系,说得委婉一点,是复杂的。不过曾经有一段时间,他们的理念大体一致。受“制造智能机器”的共同目标吸引,他们都认为视觉感知是必须攻克的关键问题。直到20世纪80年代末和90年代,让计算机“看”的主流方法还是靠手工编写的指令。比如,要让计算机识别一位手写的数字,研究人员必须写下详尽的程序,覆盖所有可能的笔画组合情况。这种基于规则的方法非常脆弱——手写稍有变化,就可能破坏逻辑。
随后出现了一系列突破。20世纪80年代末,时任AT&T贝尔实验室研究员的LeCun开发了一种强大的神经网络,通过成千上万的样本训练,它学会了识别手写的邮政编码。与此同时,在哈佛和布朗大学,也出现了另一条发展路径。1995年,朱与那里的研究团队开始开发基于概率的方法,能够学习识别图案和纹理(例如猎豹斑点、草地等),甚至还能生成新的样本。这些并不是神经网络。朱称自己的团队为“哈佛-布朗学派”,他们把视觉问题视为统计学问题,依赖于“贝叶斯推断”“马尔可夫随机场”等方法。两派使用着不同的数学语言,在哲学上也存在分歧。但他们共享一个底层逻辑:数据,而非手工指令,才是机器理解世界、复现世界模式的基础——这种思想延续到今天的人工智能系统,如ChatGPT。
在整个90年代末和2000年代初,朱与“哈佛-布朗学派”是计算机视觉领域最具影响力的声音之一。他们的统计模型帮助许多研究者认识到,数据匮乏才是阻碍AI发展的关键瓶颈。为解决这一问题,2004年,朱赴加州大学洛杉矶分校工作两年后,便与一位微软高管在家乡鄂州创立了“莲花山研究院”。研究人员对日常物体(如桌子、杯子等)的图像进行标注,并放入一个大型数据集,用于训练更强大的统计模型。莲花山研究院是最早尝试构建大规模数据集以改进和测试AI系统的项目之一。
然而到2009年,朱开始对数据驱动的方法失去信心。他的团队在莲花山已标注了超过50万张图像,但朱困扰于一个简单问题:图像的标注方式,往往依赖于研究者希望机器完成的具体任务,带有一定的任意性。比如,如果任务是让机器人识别一个杯子以便抓取,那么把手柄标出来至关重要;但如果任务是估算杯子的市场价值,那么品牌和材质的细节更为重要。朱认为,真正可泛化的智能必须能够“超越”数据去思考。他对我解释说:“比如你用一本书训练机器,它可能学会了人们是如何说话的,但我们为什么要说这些话?我们是如何想到并说出来的?”这一更深层次的认知能力是缺失的。2010年,朱关闭了研究院,转而尝试构建具有“认知架构”的智能体——能够在物理与社会环境中,以极少的数据进行推理、规划与进化。
他选择的时机再糟糕不过了。大约在同一时间,普林斯顿大学的助理教授李飞飞发布了ImageNet,这是一个更大的数据集,包含300多万张带标签的常见物体图像,例如狗、椅子和自行车。(李飞飞曾参加过莲花山研究所的一个研讨会,后来称朱教授是她的影响者之一。)ImageNet是公开的,其规模和相对简单的结构使人工智能研究人员能够测试和完善他们的图像识别算法。2012年秋季,辛顿及其团队开发的神经网络在ImageNet竞赛中大获全胜,巩固了神经网络的主导地位,并掀起了持续至今的全球人工智能应用浪潮。
“就在我对大数据敬而远之的时候,它却爆发了,”朱多年后在给导师芒福德(Mumford)的信中写道。朱与神经网络学派最公开的冲突发生在2012年,而就在几个月后,后者便在ImageNet图像识别挑战赛中大获全胜。当时,朱是美国顶级计算机视觉会议CVPR(计算机视觉与模式识别会议)的大会主席,同年,一篇由LeCun与人合著、涉及神经网络的论文遭到拒稿。LeCun给组委会写了一封措辞激烈的信,称同行评审“荒谬至极”,以至于他不知道“该如何写回复而不冒犯评审专家”。即便到了今天,朱仍坚持认为评审专家拒稿的决定是正确的。“那篇论文的理论工作不够严谨,”他告诉我,“得说清楚你到底在做什么。它好在哪里?”朱的质疑直指他对神经网络存有的核心疑虑:尽管神经网络在众多任务中表现极其出色,但要弄明白其背后的原理却并不容易。在朱看来,这催生了一种自满的文化,一种“为追求性能不惜一切代价”的心态。他认为,一个更完善的系统应当更具结构性和可靠性——无论是系统本身,还是其开发者,都应能对系统的输出结果作出解释。
尽管朱心存疑虑,ImageNet挑战赛的胜利还是引爆了人工智能领域的“淘金热”,许多神经网络领域的先驱也因其成果而备受赞誉。辛顿(Hinton)随后加入了Google;LeCun转投Meta;而与他人共同研发出那套赢得ImageNet挑战赛的神经网络系统的伊利亚·萨茨克弗(Ilya Sutskever),则协助创立了OpenAI。2018年,辛顿、LeCun与本吉奥(Bengio)凭借在神经网络领域的研究成果,共同获得了计算机科学领域的最高荣誉——图灵奖。2024年,辛顿又因“在人工神经网络机器学习领域作出开创性发现与发明”,成为诺贝尔物理学奖的联合得主之一。
在给芒福德的信中,朱称自己对所选的道路“无怨无悔”。但他坦言,令他感到不满的是,在他看来,辛顿团队收获了本该属于他早期研究的成果。朱告诉我,20世纪80至90年代,哈佛-布朗学派研发的统计模型与算法“为后来的深度学习和大型语言模型奠定了基础”。他声称,辛顿及其团队“并未认可这一点”。朱一位长期在美国工作的合作者(因担心遭到美国政府报复而要求匿名)则对朱的这一说法提出了异议。这位合作者表示,朱作为计算机视觉领域“数据驱动范式”的早期倡导者之一,确实理应获得更多认可,但辛顿团队设计出的算法才完善了这一方法,并使其具备了规模化应用的能力。(辛顿与本吉奥拒绝置评;LeCun未回应置评请求。)
2010年代中后期,当神经网络在人脸识别、疾病诊断等领域的问题上取得惊人进展时,朱却在研读哲学——他告诉我,儒家学者“对世界的理解比人工智能研究者深刻得多”——同时默默钻研自己的认知架构理论。他正走着一条孤独的道路。2019年,朱再次担任CVPR大会主席。在审阅提交的论文时,他的心沉了下去:几乎所有论文都只关注在特定狭窄任务上,通过神经网络实现微小的性能提升。此时,朱对神经网络的反对已变得发自内心。加州大学洛杉矶分校一位曾师从朱的博士生回忆,自己因在论文中暗中使用神经网络,曾多次遭到朱的斥责。朱身边的人都知道要避开那些“禁忌词汇”——“神经网络”(neural nets)、“深度学习”(deep learning)、“Transformer”(即GPT中的“T”)。有一次,在朱于洛杉矶创办的一家初创公司的全员会议上,一名新员工无意中在演示文稿里加了一张关于深度学习的幻灯片。据当时在场的人透露,朱在全公司人面前怒斥了这名员工。(朱则称此事“被夸大了”。)
“一旦他确立了某种愿景,”朱的一位长期合作者如是评价,语气中带着几分委婉,“他就会极其坚定地认为自己是对的。”
随着朱松纯的理念被边缘化,美国对于华裔科学家的整体环境也变得越来越不那么友好。2018 年,美国司法部启动了“中国计划”,该计划的批评者声称其依赖种族定性。超过 100 名华裔教授因涉嫌窃取敏感技术而受到调查。大多数被正式指控的人的指控都被驳回或撤销,很少有人被发现参与了直接的知识产权盗窃。特朗普时代改变了华裔科学家与美国的关系。根据一项著名的学术研究,2018 年后,在美国的资深华人学者的回国数量几乎翻了一番。
2018年底,朱先生开始接到硅谷新闻网站The Information记者的电话,询问他最近从中国电信巨头华为获得的15万美元资助。同月,美国将华为列为国家安全威胁。朱先生告诉我,这笔华为的钱没有任何附加条件,他用这笔钱资助了他的博士生的研究。为了尽快平息此事,他告诉记者,他以后不会接受华为的任何捐款。“目前,中美关系很糟糕,”他当时说道,“我们被夹在中间了。”
随着中美关系恶化,朱发现获得人工智能研究资金越来越困难,此前这些资金大部分来自美国军方。他说,他从未被联邦特工盘问过,也没有被美国边境官员拦下询问他的研究和与中国的关系,但他以前的博士生却被拦下问话。据尼茨伯格说,“中国计划”启动后,朱的一些学生已经习惯了在入境处被耽搁,以至于他们在安排参加会议的行程时,会把在机场的额外时间预留出来。
在这种环境下,中国被视为美国的直接竞争对手,甚至是威胁,长期以来被视为正常的与中国的科学联系现在笼罩在怀疑的阴云之下。这在很大程度上是基于对学术研究实际运作方式的误解。2024 年,众议院迈克·加拉格尔要求加州大学洛杉矶分校和联邦机构提供文件,点名朱松纯为何能获得数百万美元的联邦资助。
五月,我第二次拜访朱的办公室时,我们讨论了这些指控。一位秘书给我们倒了茶,茶杯一空就给我们续。朱否认与北京理工大学有任何关系,但承认他曾共同指导过一位来自北京理工大学的博士生,该博士生在莲花山实验室工作。他还告诉我,2009年,他在加州大学洛杉矶分校工作期间,他的莲花山团队曾向鄂州市政府申请过一项地方人才计划的资助,他用这笔钱补贴研究人员的工资。他还补充说,在那里进行的图像注释工作并没有什么“敏感”之处。他说,2010年他关闭研究所后,资金就失效了。至于为什么选择在中国设立研究所,朱民说,原因与这些年来在中国设立的数千家其他美国企业一样,人工成本低。
朱松纯说,2020年夏天,他决定离开美国。他表示,自己对人工智能领域的发展方向以及美国的政治气候感到不满。此外,还有个人因素。他的小女儿朱易是一名花样滑冰运动员,2018年被招募代表中国参加2022年北京冬奥会。到2019年,她已成为中国公民,并在北京与中国队一起比赛和训练。
朱告诉我,在决定离开的时候,他当时并没有收到任何来自中国机构的工作邀请。到了秋天,他才先后收到了北京大学和清华大学的全职教授职位邀请。随后,北京市同意资助由朱主导的一所人工智能研究院,该研究院将被命名为“北京通用人工智能研究院(BigAI)”。
然而,两位知情人士对朱的时间线提出了质疑。他们表示,朱与北京市的谈话开始得更早——在2018年初——而且讨论的不仅是他可能回国的问题,还涉及到他的小女儿。2018年1月,朱易在美国花样滑冰锦标赛上获得了新秀组冠军。不久后,中国奥委会将她与自由式滑雪运动员谷爱凌一同招入同一批次。当我将这些质疑转述给朱时,他称这些网络上的猜测“完全错误”,“这不是中国的运作方式”。他说在2018年初确实讨论过女儿的招募事宜,但否认在这些对话中曾讨论过他自己的回国。
2020年8月,朱买了一张单程机票飞往中国。加州大学洛杉矶分校的许多同事和研究生直到他已经离开,才知道他有离开的打算。他甚至对住在湾区的大女儿也隐瞒了这一决定。朱把自己的保密归因于环境的动荡。特朗普第一任期内,针对华人的仇恨犯罪激增。我理解朱的意思是,他不想因为搬迁的决定而被公开当作替罪羊。他清楚自己的个人选择承载着更大的地缘分量。
在离开美国的那个早晨,朱站在自家屋外,拉着行李箱,望向阳光洒落的洛杉矶群山。在车道的尽头,他回过头,停下脚步,欣赏了一眼自己的玫瑰园。那是他童年时听着村庄外世界的故事所能想象到的一切。如今,他在告别。
朱松纯第二次落泪——他说“感动不已”——是和学生们一起观看钱学森生平的纪录片时。钱学森出生于中国,毕业于麻省理工学院,是火箭科学家,参与了曼哈顿计划,帮助研发了美国第一枚弹道导弹。在麦卡锡时代,美国当局因涉嫌间谍活动吊销了钱学森的安全许可并将他软禁。由于没有证据支持这些指控,1955年,美国将他遣返回中国以换取美国战俘。回国后,钱学森领导了一系列军事和技术突破,帮助中国成为今天的超级大国。在他领导的“两弹一星”计划下,中国发展出了发射可打击美国的弹道导弹的能力。
在美国,钱学森的故事被视为美国自我毁灭的警示故事。在中国的版本中,钱学森是一位无私的爱国者,他心甘情愿放弃在美国舒适的生活,来为落后的祖国服务。20世纪80年代,钱学森在朱松纯这样的有抱负的科学家群体中家喻户晓。自从朱松纯回国后,两者之间的相似之处就更加明显了。当我问他关于这个建议的问题时,他的回答很低调。“在美国,学者一直希望启动人工智能的曼哈顿计划,”他说。“中国也应该有一个人工智能计划。这是很自然的,这不是什么秘密。”
当我问他,谁赢得人工智能竞赛——美国还是中国——是否重要时,他顿了顿。“我希望硅谷赢吗?可能不会。”他说,他希望最符合伦理道德的人工智能版本获胜。
在我们交谈中,朱松纯指出,考虑到特朗普第二届政府的焦土政治,他的离职现在看来是多么有先见之明。在最近的一项民意调查中,四分之三的美国科学家表示他们正在考虑离开。包括 LeCun 在内的许多人工智能领袖都公开表示,特朗普削减科研预算将如何损害他们的工作。中国的大学利用这股人才外流的浪潮,吸引哈佛学生和在最近联邦预算削减后失业的研究人员。欧盟也在做同样的事情。
美国右翼普遍认为,美国已经失去了曼哈顿计划或阿波罗计划所体现的雄心壮志,而且正在落后。中国电动汽车在欧洲乡村飞驰,美国药店严重依赖中国制造的原料。中国在科技期刊上发表的论文数量已经超过美国,而且这一差距可能还会扩大。每年从中国大学毕业的STEM 专业学生数量是美国的四倍。危险在于,在赶走国际人才的过程中,美国有可能失去曾经相对于竞争对手的优势之一。(“我在北京大学的博士生至少与麻省理工学院和斯坦福大学的博士生不相上下,”朱自豪地告诉我。)对世界上最聪明的头脑的开放帮助美国在人工智能以及无数其他领域确立了领先地位。
朱松纯离开美国时,他的合作者担心他在中国的研究会失去独立性。相反,朱松纯表示,他觉得在北京专注于研究更自由。在实践中,中国科学家往往享有相当大的自主权,如果他们在具有战略意义的领域工作,就能获得充分的资源。
在美国,原则上从未受到束缚的学者如今感受到了特朗普政府的突然打击。数十亿美元的研究经费被暂停,直到大学默许哈佛大学校长所说的对大学“知识环境”的“政府直接监管”。今年3月,哥伦比亚大学同意对其中东、南亚和非洲研究系进行新的监管。香港科技大学前校长、加州大学洛杉矶分校前学院院长陈繁昌在两种大学体系都有工作经验。他告诉我,他现在在美国看到的情况十分糟糕。“我们过去可以清楚地说,美国大学独立于政客。这是美国学术体系的优势,”陈繁昌告诉我。“我现在不能再这么说了。”
在中国和美国,朱都以一位严格的学术导师闻名,坚持严苛的学术正统。据他在北京的现任学生说,他有一句常挂在嘴边的话,如今已被制作成动图,在他们的群聊里广泛流传:“如果你再这样做,就会被开除!”换句话说,朱不是一个容易被说服的人。因此,当 OpenAI 在2022年推出 ChatGPT 时,中国科技界大为震惊——一位中国人工智能创业者甚至承认自己感到“迷失”,并且“失眠”,因为被西方再次超越而备受打击——但朱却毫不动摇。2023年初的一次人工智能研讨会上,他避免对 ChatGPT 作为技术成就给予任何赞美。他说,大语言模型“仍然无法”达到通用人工智能的标准,因为它们并不“具备理解或与人类价值观对齐的能力”。
同年晚些时候,朱认为对自己人生有重大影响、因录取他进入哈佛而改变了他命运的教授芒福德前往北京领取一项数学奖。当时芒福德已年逾八十,退休近十年。芒福德告诉我,若不是想“看看宋君在做什么”,他大概不会成行。两人关系十分亲近,过去常在朱的UCLA实验室见面。在朱的北京大学办公室里,挂着一封芒福德写给他的信,信中写道:“我觉得你确实是我的学术继承人。”
2025年3月,北京中关村论坛上,一个类人机器人与记者握手。图片来源:VCG/Getty Images
然而,他们并非事事都意见一致。尽管朱在很大程度上对神经网络不屑一顾,但芒福德却在其数学结构中看到了一些深刻的东西,他想鼓励这位昔日的学生重新审视自己的观点。“最重要的是,”芒福德告诉我,“我想表达的是,我认为 BigAI 要想成功,必须拥有一个庞大的团队来研究深度学习技术。”
在北京,芒福德陪朱松纯漫步于北大校园的小溪、柳树和铺好的道路上,并与朱松纯的家人共进晚餐。之后,芒福德开始阐述他的观点。朱松纯的朋友和学生告诉我,他的方案似乎在某种程度上奏效了。他允许学生在某些任务上试验Transformer——最先进的神经网络架构。曾经将神经网络偷偷带入像Contropband这样的项目的研究人员表示,他们可以更公开地使用它们。芒福德后来告诉我,朱松纯是“迄今为止我所教过的计算机视觉领域最聪明的学生”。然而,“他花了很长时间才意识到深度学习正在创造巨大的奇迹。我认为这是他的一个重大错误。”
尽管如此,在朱的通用人工智能愿景中,神经网络的作用始终有限。“我们并不是拒绝这些方法,”朱告诉我,“我们只是说它们有自己的用武之地。”
三月的一个周六早上,朱邀请我参加在北京举行的年度科技论坛,BigAI 正在会场展示其最新技术。一只机器狗在会议大楼里蹦蹦跳跳,围观者高喊着指令(“坐下!坐下!我说坐下!”)。不远处,孩子们围着一根细长的机械臂,下着围棋策略游戏。主厅外,一个有着杏仁色眼睛的人形女性头部茫然地凝视着人群。当访客走近时,它会扫描对方的面部。很快,它的硅胶皮肤开始抽动,扭出与访客相似的面部表情。
在去年的科技论坛上,BigAI 发布了一个名为 TongTong 的虚拟人形儿童机器人,他们希望它能够具备大多数人工智能所缺乏的能力。研究人员普遍认为,对物理和社会世界运作方式的常识性直觉是神经网络最难掌握的技能之一。正如 LeCun 最近所说:“我们拥有能够通过律师资格考试的法学硕士,所以他们一定很聪明。但他们不可能像任何 17 岁的孩子一样在 20 小时内学会开车,也不可能像任何 10 岁的孩子一样一次性学会把碗碟装满洗碗机。这是为什么呢?我们缺少什么?” TongTong 还没有准备好从事法律工作,但它似乎能够把碗碟装进洗碗机。它的设计初衷是模仿三到四岁儿童的认知和情感能力。
今年,BigAI 团队首次推出了TongTong 2.0,他们声称它拥有五六岁儿童的能力。在一个大屏幕上,TongTong 2.0 以动画女孩的形象出现在虚拟客厅中。在会议室前面,一位 BigAI 工程师正在现场演示 TongTong 的能力。当工程师要求 TongTong 与她的朋友 LeLe(另一个 AI 代理)合作寻找玩具时,TongTong 似乎避开了她朋友已经搜索过的区域。后来,当 TongTong 被要求从够不着的书架上取回电视遥控器时,她用垫子给自己额外的支撑。(当提示 ChatGPT 执行类似任务时,研究人员发现它是一个“缺乏经验的常识性问题解决者”。朱松纯认为,ChatGPT 等深度学习系统无法克服这一弱点。)
目前,TongTong 仅作为一款在模拟环境中运行的软件存在,而非物理世界中的 3D 机器人。演讲结束后,BigAI 宣布与多家机器人公司建立合作伙伴关系。对朱的技术而言,一个关键的考验在于它能否以具身系统的形式存在,并仍然能够执行他所重视的推理和规划功能。
演讲开始前,朱松纯身着蓝色西装登上讲台,发表主题演讲。他首先将自己的人工智能理念与所谓的“硅谷叙事”进行了对比,后者认为通用人工智能可以通过更多数据和计算能力来实现。正如朱松纯在后来发表的演讲稿中所说,媒体、公众和机构一直被一种虚假的叙事所误导,这种叙事催生了大量空洞的中国“人工智能研究所”,并抬高了初创企业的估值。这种误导的后果之一是,它让中国人误以为他们是西方“束缚”(或称“kabozi”)的受害者。“kabozi”一词后来被用来指代美国对华高端计算机芯片的出口管制。对朱松纯来说,阻碍人工智能进步的关键因素并非计算能力不足,而是对整个主题的错误认识。这场最初在会议和同行评审期刊上进行的学术争论,如今似乎卷入了一场划时代的技术霸权之争。
朱松纯的观点非常一致,但表达信息的方式多年来却有所转变。朱松纯表示,中国需要“抵制盲目追随”硅谷的叙事,发展自己“自给自足”的人工智能战略。然而,在我与朱松纯的四次会面中,我感觉他更关注的是学术争论的利害关系,而非两国之间的国际竞争——他分别在这两个国家度过了人生的一半时光。
当我离开朱的四合院时,已是傍晚。太阳斜落到屋顶之下,把玉兰花映照得一片粉红。朱陪我走到标记着他办公室入口的格栅篱笆前。他想再次强调,“过去30年,我一直专注于一件事。那就是人工智能的统一理论。为了建立理解。这是我唯一的动力,”他对我说。他又提起了自己与芒福德的研究。“哈佛-布朗计算机科学学派,”朱自豪地说。“这正是我们在这里延续的东西。”
本文出处:https://www.theguardian.com/news/ng-interactive/2025/sep/16/song-chun-zhu-why-one-of-the-worlds-most-brilliant-ai-scientists-left-the-us-for-china
踩一下[0]
顶一下[0]