在 AI 發展如火如荼的今天,學術界與工業界正以前所未有的速度向前狂奔。但在這片繁榮的背後,似乎有一股潛流正在悄悄侵蝕着研究的本質。美國紐約大學助理教授、CV 領域著名學者、2023 年度《麻省理工科技評論》“35 歲以下科技創新 35 人”中國區入選者謝賽寧(Saining Xie)最近在一場深度分享中,向整個學界發出警告:當前的人工智能研究正面臨着從“無限遊戲”向“有限遊戲”轉變的危險趨勢,而這種轉變可能會從根本上損害科學研究的本質和長遠發展。他以紐約大學歷史學教授詹姆斯·卡斯(James Carse)的經典理論爲引,剖析了當前 AI 研究領域日益顯現的“有限遊戲”困境,並呼籲研究者們迴歸到更具生命力的“無限遊戲”之中。


爲何研究應當是一場無限遊戲?
詹姆斯·卡斯將世界上的所有人類活動分爲兩種遊戲:有限遊戲與無限遊戲。
有限遊戲,其目的在於“贏得”遊戲。它有明確的邊界、固定的規則和已知的參與者。比賽一旦分出勝負,遊戲便宣告結束。一場足球賽或一場商業上的產品發佈競賽,都是典型的有限遊戲,其特點是目標明確、結果導向、有始有終。

(來源:謝賽寧)
而無限遊戲則完全不同。它的唯一目的,是讓遊戲“永遠進行下去”。在無限遊戲中,沒有明確的邊界,規則可以改變,參與者也可以不斷變化。這裏的“玩”,不是爲了戰勝對手,而是爲了探索遊戲本身的邊界,並邀請更多人加入。友誼、文化,乃至科學本身,都是典型的無限遊戲。它們沒有終點線,唯一的失敗,就是因無人蔘與而導致遊戲終止。

(來源:謝賽寧)
謝賽寧認爲,科學研究,其本質就應該是一場宏大的無限遊戲。從古至今,科學的火種之所以不滅,正是因爲它始終在邀請後來者加入,不斷挑戰已知,拓展人類認知的邊界。
他系統地闡述了爲何研究的內在精神與無限遊戲的特質高度契合。他認爲,研究的生命力體現在反脆弱性、開放性、持久性和教育意義這四個維度上,而這些都指向了無限遊戲的本質。
首先,無限遊戲是反脆弱的,研究者也應如此。在科研中,一次意外的實驗結果,對於有限遊戲玩家是“損失”,但對於無限遊戲玩家而言,卻是通往新發現的“驚喜”和“信息”。如下面這幅圖表所示,一篇論文對職業生涯的影響是非線性的:平庸的論文影響甚微,而真正具有“創造性、原創性且優質”的論文,其影響力是指數級的。這意味着,探索未知所帶來的潛在收益,遠大於固守常規,這正是在不確定性中獲益的反脆弱性。

(來源:謝賽寧)
那麼該“如何找到真正屬於你的研究想法?”謝賽寧提出了三個建議:首先,跟隨你的好奇心和激情,讓它們指引你的方向;其次,保持探索性,在數學和實驗中自由探索;最重要的是,對意外保持開放,因爲驚喜往往是真正想法的來源。他特別警告研究者避免一個常見陷阱:在第一天就固定一個想法,然後發表一篇從未超越這個初始想法的論文,這往往是最薄弱的工作。

(來源:謝賽寧)
其次,無限遊戲的核心是開放性。有限遊戲的玩家試圖控制未來,而無限遊戲的玩家則以開放的心態擁抱未來,期待被“驚喜”所改變。當“驚喜”不再可能時,一切遊戲都將停止。這完美契合了“開放科學”的理念——知識的價值在於分享與碰撞,而非守護與壟斷。他特別強調,學術界是當今社會中爲數不多的、能賦予研究者以完全自由去進行開放式探索的空間,這是一種應當被珍視的特權。

(來源:謝賽寧)
再者,無限遊戲需要持久性。面對挫折,一個有限遊戲玩家可能會認爲“我失敗了”;而一個無限遊戲玩家則會將其視爲漫長旅程的一環,並思考“如何從中學習並繼續前進?”。謝賽寧分享了自己團隊的一些研究經歷作爲例證。他們的擴散變換器(DiT,Diffusion Transformer)項目在截止日期前三週才轉向,被 CVPR 2023 拒絕(理由是“缺乏新穎性”),也被幾家公司拒絕。然而,他們沒有放棄,重新提交後在 ICCV 2023 獲得了口頭報告,後來 Bill Peebles 將 DiT 技術擴展應用到了 Sora 項目中。“有時你需要等待——有時,你只需要找到讓它實現的方法!”

(來源:謝賽寧)
類似的故事還有團隊的另一個項目 SiT(Scalable Interpolant Transformers),這是第一個研究基於流匹配的擴散變換器模型縮放規律的工作。該論文同樣被 CVPR 2024 以“缺乏新穎性”爲由拒絕,但經過輕微修改後被 ECCV 2024 接收。幾個月後,Stability AI 發佈的 Stable Diffusion 3 正式宣佈“結合了擴散變換器架構和流匹配”,驗證了這項研究的前瞻性價值。

(來源:謝賽寧)
最後,這一切都關乎教育的真正意義。從有限遊戲的角度看,讀博是完成一系列任務以贏得“博士”頭銜。但從無限遊戲的角度看,讀博的真正價值在於,它教會一個人如何學習、如何提出問題、如何與失敗共處,這是一種“成爲反脆弱者”的訓練。畢業不是“贏得”了研究,而是獲得了繼續參與這場無限遊戲的入場券。

(來源:謝賽寧)

自我的天才:如何玩好你自己的遊戲?
在報告的第二部分,謝賽寧將視角轉向研究者個體,提出了一個核心觀點:“我是我自己的天才”,鼓勵每位研究者去設計和玩好屬於自己的遊戲。
他引用思想家漢娜·阿倫特的話:“我要追求影響嗎?不,我想要理解。當其他人以我理解的同樣方式理解時——這給了我滿足感,一種歸屬感。”科研的內在動機並非追求量化的“影響力”,而是爲了實現深層次的“理解”與“歸屬感”。那麼,如何設計自己的“玩法”呢?謝賽寧認爲,在無限遊戲中脫穎而出,不是通過戰勝他人,而是通過“做自己,並啓發他人”。這背後,是研究者個人“品味”和“風格”的塑造。

(來源:謝賽寧)
例如,他展示了 Meta AI 關於 MobileLLM 的一系列消融實驗圖表,其清晰的邏輯、嚴謹的變量控制、層層遞進的分析,形成了一種獨特的“Saining Plot”風格。這種風格被同行注意到,甚至在社交媒體上被命名和討論。這表明一種可識別的研究範式本身就具有強大的傳播力和啓發性。他又提及了何愷明“一張圖表,一個信息”(One Table, One Message!)的極簡主義研究哲學,以及 MoCo 等工作中體現出的“簡潔、有原則的方法”(Clean, Principled Method)。這些都是頂級研究者通過其作品所展現出的獨特“品牌標識”。

(來源:謝賽寧)
他進一步強調,研究者需要“品牌化你的論文、你的工作,以及你自己”(Brand your papers, your work, yourself)。他展示了自己實驗室一系列項目的網頁設計,每個項目都有獨特的視覺標識、清晰的核心信息和一致的呈現風格。他告誡年輕學者:“不要只是成爲‘Nerfies’(指代某個熱門領域的衆多跟風者)中的一員。”這實際上是在鼓勵研究者建立自己的學術身份,發出獨特的聲音,而不僅僅是淹沒在熱點的浪潮中。

(來源:謝賽寧)

AI 研究正滑向有限遊戲的陷阱
在建立了理論框架並闡釋了科學研究的理想特徵後,謝賽寧將注意力轉向了當前 AI 研究領域的現實狀況。他指出,整個領域正在不知不覺中偏離無限遊戲的軌道,滑向有限遊戲的陷阱。謝賽寧直面當前 AI 領域的隱憂,揭示了其日益陷入“有限遊戲”的危險趨勢。
他指出了目前學界一種令人擔憂的研究模式:一個主要的“有限遊戲玩家”(如行業巨頭)發佈一篇重磅成果,比如 GPT-4V、o1、GRPO 等,緊接着,學術界便湧現出海量的跟進工作,所有人都爭先恐後地在同一個狹窄的主題上發表文章,只爲爭奪“第一”的頭銜。在這場“競速賽”中,“第一個”發表的人贏得了關注,而後來者,即便有更深入的貢獻,也常常被忽視。一旦“第一篇”論文出現,許多研究者便會迅速放棄該主題,轉向下一個熱點。

(來源:謝賽寧)
這種模式給研究者,特別是學生和青年學者,帶來了巨大的壓力和不可持續的研究節奏。更嚴重的是,它背後反映出一個有缺陷的學術激勵體系:它獎勵速度而非深度,獎勵短期勝利而非長期貢獻。“如果學術界選擇玩一場有限遊戲,它最終將輸掉一切。”
那麼,出路何在?謝賽寧給出的答案是:定義新的問題。他再次以自己的項目 V*(一個關於視覺搜索的 MMLM 機制研究)爲例。這個項目始於對人類心理學根本問題的思考,而非追逐熱點,在初期甚至遭到了審稿人的質疑。然而團隊堅持了下來,當“用圖像思考”成爲新的行業熱點時,V* 作爲一個前瞻性的研究,自然地成爲了該領域的重要基準。這個案例證明,真正的創新源於對根本問題的持久思考和勇敢開拓,這正是無限遊戲玩家對抗有限遊戲陷阱的有力武器。

(來源:謝賽寧)

無人能孤身成賽:我們共同的遊戲
在報告的結尾,謝賽寧將視野拉回到了“社區”這個宏大的命題上。他引用“沒有人能獨自玩一場遊戲”,強調了學術共同體的重要性。

(來源:謝賽寧)
他回顧了歷史,用兩個截然不同的觀點做對比:2010 年,一篇博客文章悲觀地斷言“做計算機視覺找不到工作”;而 2013 年,一位導師卻鼓勵他:“你應該做計算機視覺,CVPR 是開放、包容且不設門檻的。”後者的無限遊戲心態,最終被證明是正確的。如今,CVPR 的論文提交量逐年暴增,但這並不自動意味着一個健康的無限遊戲生態。更多的參與者,如果都抱着有限遊戲的心態,反而會加劇內卷和競爭。

(來源:謝賽寧)
因此,維護一個強大、開放、互助的社區,是每個參與者的責任。他呼籲大家不要將社區的存在視爲理所當然,每個人都應在其中扮演積極的角色,共同將 AI 研究領域建設成一個對所有人開放的、生生不息的無限遊戲。

(來源:謝賽寧)
參考資料:
1.https://www.canva.com/design/DAGp0iRLk9g/8QLkIDov8ez1q6VvO8nnpQ/edit
運營/排版:何晨龍