在 AI 发展如火如荼的今天,学术界与工业界正以前所未有的速度向前狂奔。但在这片繁荣的背后,似乎有一股潜流正在悄悄侵蚀着研究的本质。美国纽约大学助理教授、CV 领域著名学者、2023 年度《麻省理工科技评论》“35 岁以下科技创新 35 人”中国区入选者谢赛宁(Saining Xie)最近在一场深度分享中,向整个学界发出警告:当前的人工智能研究正面临着从“无限游戏”向“有限游戏”转变的危险趋势,而这种转变可能会从根本上损害科学研究的本质和长远发展。他以纽约大学历史学教授詹姆斯·卡斯(James Carse)的经典理论为引,剖析了当前 AI 研究领域日益显现的“有限游戏”困境,并呼吁研究者们回归到更具生命力的“无限游戏”之中。
图丨相关推文(来源:X)
为何研究应当是一场无限游戏?
詹姆斯·卡斯将世界上的所有人类活动分为两种游戏:有限游戏与无限游戏。
有限游戏,其目的在于“赢得”游戏。它有明确的边界、固定的规则和已知的参与者。比赛一旦分出胜负,游戏便宣告结束。一场足球赛或一场商业上的产品发布竞赛,都是典型的有限游戏,其特点是目标明确、结果导向、有始有终。
(来源:谢赛宁)
而无限游戏则完全不同。它的唯一目的,是让游戏“永远进行下去”。在无限游戏中,没有明确的边界,规则可以改变,参与者也可以不断变化。这里的“玩”,不是为了战胜对手,而是为了探索游戏本身的边界,并邀请更多人加入。友谊、文化,乃至科学本身,都是典型的无限游戏。它们没有终点线,唯一的失败,就是因无人参与而导致游戏终止。
(来源:谢赛宁)
谢赛宁认为,科学研究,其本质就应该是一场宏大的无限游戏。从古至今,科学的火种之所以不灭,正是因为它始终在邀请后来者加入,不断挑战已知,拓展人类认知的边界。
他系统地阐述了为何研究的内在精神与无限游戏的特质高度契合。他认为,研究的生命力体现在反脆弱性、开放性、持久性和教育意义这四个维度上,而这些都指向了无限游戏的本质。
首先,无限游戏是反脆弱的,研究者也应如此。在科研中,一次意外的实验结果,对于有限游戏玩家是“损失”,但对于无限游戏玩家而言,却是通往新发现的“惊喜”和“信息”。如下面这幅图表所示,一篇论文对职业生涯的影响是非线性的:平庸的论文影响甚微,而真正具有“创造性、原创性且优质”的论文,其影响力是指数级的。这意味着,探索未知所带来的潜在收益,远大于固守常规,这正是在不确定性中获益的反脆弱性。
(来源:谢赛宁)
那么该“如何找到真正属于你的研究想法?”谢赛宁提出了三个建议:首先,跟随你的好奇心和激情,让它们指引你的方向;其次,保持探索性,在数学和实验中自由探索;最重要的是,对意外保持开放,因为惊喜往往是真正想法的来源。他特别警告研究者避免一个常见陷阱:在第一天就固定一个想法,然后发表一篇从未超越这个初始想法的论文,这往往是最薄弱的工作。
(来源:谢赛宁)
其次,无限游戏的核心是开放性。有限游戏的玩家试图控制未来,而无限游戏的玩家则以开放的心态拥抱未来,期待被“惊喜”所改变。当“惊喜”不再可能时,一切游戏都将停止。这完美契合了“开放科学”的理念——知识的价值在于分享与碰撞,而非守护与垄断。他特别强调,学术界是当今社会中为数不多的、能赋予研究者以完全自由去进行开放式探索的空间,这是一种应当被珍视的特权。
(来源:谢赛宁)
再者,无限游戏需要持久性。面对挫折,一个有限游戏玩家可能会认为“我失败了”;而一个无限游戏玩家则会将其视为漫长旅程的一环,并思考“如何从中学习并继续前进?”。谢赛宁分享了自己团队的一些研究经历作为例证。他们的扩散变换器(DiT,Diffusion Transformer)项目在截止日期前三周才转向,被 CVPR 2023 拒绝(理由是“缺乏新颖性”),也被几家公司拒绝。然而,他们没有放弃,重新提交后在 ICCV 2023 获得了口头报告,后来 Bill Peebles 将 DiT 技术扩展应用到了 Sora 项目中。“有时你需要等待——有时,你只需要找到让它实现的方法!”
(来源:谢赛宁)
类似的故事还有团队的另一个项目 SiT(Scalable Interpolant Transformers),这是第一个研究基于流匹配的扩散变换器模型缩放规律的工作。该论文同样被 CVPR 2024 以“缺乏新颖性”为由拒绝,但经过轻微修改后被 ECCV 2024 接收。几个月后,Stability AI 发布的 Stable Diffusion 3 正式宣布“结合了扩散变换器架构和流匹配”,验证了这项研究的前瞻性价值。
(来源:谢赛宁)
最后,这一切都关乎教育的真正意义。从有限游戏的角度看,读博是完成一系列任务以赢得“博士”头衔。但从无限游戏的角度看,读博的真正价值在于,它教会一个人如何学习、如何提出问题、如何与失败共处,这是一种“成为反脆弱者”的训练。毕业不是“赢得”了研究,而是获得了继续参与这场无限游戏的入场券。
(来源:谢赛宁)
自我的天才:如何玩好你自己的游戏?
在报告的第二部分,谢赛宁将视角转向研究者个体,提出了一个核心观点:“我是我自己的天才”,鼓励每位研究者去设计和玩好属于自己的游戏。
他引用思想家汉娜·阿伦特的话:“我要追求影响吗?不,我想要理解。当其他人以我理解的同样方式理解时——这给了我满足感,一种归属感。”科研的内在动机并非追求量化的“影响力”,而是为了实现深层次的“理解”与“归属感”。那么,如何设计自己的“玩法”呢?谢赛宁认为,在无限游戏中脱颖而出,不是通过战胜他人,而是通过“做自己,并启发他人”。这背后,是研究者个人“品味”和“风格”的塑造。
(来源:谢赛宁)
例如,他展示了 Meta AI 关于 MobileLLM 的一系列消融实验图表,其清晰的逻辑、严谨的变量控制、层层递进的分析,形成了一种独特的“Saining Plot”风格。这种风格被同行注意到,甚至在社交媒体上被命名和讨论。这表明一种可识别的研究范式本身就具有强大的传播力和启发性。他又提及了何恺明“一张图表,一个信息”(One Table, One Message!)的极简主义研究哲学,以及 MoCo 等工作中体现出的“简洁、有原则的方法”(Clean, Principled Method)。这些都是顶级研究者通过其作品所展现出的独特“品牌标识”。
(来源:谢赛宁)
他进一步强调,研究者需要“品牌化你的论文、你的工作,以及你自己”(Brand your papers, your work, yourself)。他展示了自己实验室一系列项目的网页设计,每个项目都有独特的视觉标识、清晰的核心信息和一致的呈现风格。他告诫年轻学者:“不要只是成为‘Nerfies’(指代某个热门领域的众多跟风者)中的一员。”这实际上是在鼓励研究者建立自己的学术身份,发出独特的声音,而不仅仅是淹没在热点的浪潮中。
(来源:谢赛宁)
AI 研究正滑向有限游戏的陷阱
在建立了理论框架并阐释了科学研究的理想特征后,谢赛宁将注意力转向了当前 AI 研究领域的现实状况。他指出,整个领域正在不知不觉中偏离无限游戏的轨道,滑向有限游戏的陷阱。谢赛宁直面当前 AI 领域的隐忧,揭示了其日益陷入“有限游戏”的危险趋势。
他指出了目前学界一种令人担忧的研究模式:一个主要的“有限游戏玩家”(如行业巨头)发布一篇重磅成果,比如 GPT-4V、o1、GRPO 等,紧接着,学术界便涌现出海量的跟进工作,所有人都争先恐后地在同一个狭窄的主题上发表文章,只为争夺“第一”的头衔。在这场“竞速赛”中,“第一个”发表的人赢得了关注,而后来者,即便有更深入的贡献,也常常被忽视。一旦“第一篇”论文出现,许多研究者便会迅速放弃该主题,转向下一个热点。
(来源:谢赛宁)
这种模式给研究者,特别是学生和青年学者,带来了巨大的压力和不可持续的研究节奏。更严重的是,它背后反映出一个有缺陷的学术激励体系:它奖励速度而非深度,奖励短期胜利而非长期贡献。“如果学术界选择玩一场有限游戏,它最终将输掉一切。”
那么,出路何在?谢赛宁给出的答案是:定义新的问题。他再次以自己的项目 V*(一个关于视觉搜索的 MMLM 机制研究)为例。这个项目始于对人类心理学根本问题的思考,而非追逐热点,在初期甚至遭到了审稿人的质疑。然而团队坚持了下来,当“用图像思考”成为新的行业热点时,V* 作为一个前瞻性的研究,自然地成为了该领域的重要基准。这个案例证明,真正的创新源于对根本问题的持久思考和勇敢开拓,这正是无限游戏玩家对抗有限游戏陷阱的有力武器。
(来源:谢赛宁)
无人能孤身成赛:我们共同的游戏
在报告的结尾,谢赛宁将视野拉回到了“社区”这个宏大的命题上。他引用“没有人能独自玩一场游戏”,强调了学术共同体的重要性。
(来源:谢赛宁)
他回顾了历史,用两个截然不同的观点做对比:2010 年,一篇博客文章悲观地断言“做计算机视觉找不到工作”;而 2013 年,一位导师却鼓励他:“你应该做计算机视觉,CVPR 是开放、包容且不设门槛的。”后者的无限游戏心态,最终被证明是正确的。如今,CVPR 的论文提交量逐年暴增,但这并不自动意味着一个健康的无限游戏生态。更多的参与者,如果都抱着有限游戏的心态,反而会加剧内卷和竞争。
(来源:谢赛宁)
因此,维护一个强大、开放、互助的社区,是每个参与者的责任。他呼吁大家不要将社区的存在视为理所当然,每个人都应在其中扮演积极的角色,共同将 AI 研究领域建设成一个对所有人开放的、生生不息的无限游戏。
(来源:谢赛宁)
参考资料:
1.https://www.canva.com/design/DAGp0iRLk9g/8QLkIDov8ez1q6VvO8nnpQ/edit
运营/排版:何晨龙