OpenClaw之父加入OpenAI後亮相:被谷歌限制,AI讓我激動到睡不着

由 DeepTech深科技 發佈於 科技

'26-02-26

OpenClaw 項目自今年發佈以來,引發了大量關注,GitHub 平臺上的星標一度飆升到約 20 萬。在該項目成爲開發者社區現象級爆火之後,也迅速引爆了另一場更大的行業衝突:平臺控制與開源自由的博弈。


就在幾天前,谷歌限制了部分開發者通過 OpenClaw 調用 Antigravity 平臺後端服務的賬戶訪問權限,理由是認爲其“惡意使用”。



(來源:谷歌)


谷歌 DeepMind 工程總監 Varun Mohan 迅速在社交媒體上做出解釋:“我們發現惡意使用 Antigravity 後端的情況激增,嚴重影響了用戶的服務質量。我們需要儘快找到一種方法,切斷這些未按預期使用產品用戶的訪問權限。我們理解部分用戶並不瞭解這種行爲違反了我們的服務條款,我們會爲他們提供恢復訪問權限的途徑,但由於資源有限,我們希望公平對待所有正常用戶。”



(來源:X)


相關限制措施引發了 OpenClaw 創始人 Peter Steinberger 的強烈不滿,他馬上吐槽谷歌這種“沒有警告,也沒有補救措施”的做法太嚴苛了,更是直言“看來我得停止對谷歌的支持了。”



(來源:X)


當然,這些風波也並未影響 Peter 近期的活動,比如他參加了編程黑客馬拉松 Codex Hackathon,還舉辦了專門圍繞 OpenClaw 的活動 ClawCon。2 月 25 日,他接受了 OpenAI 的深度訪談,這是繼幾天前他宣佈加入 OpenAI 後的首次亮相。


在這次訪談中,Peter 談到了 OpenClaw 的開源之旅,如何使用 Codex 進行開發,以及 OpenClaw 濫用和安全問題等。一個“頓悟時刻”來源於 Peter 將 AI 智能體接入 WhatsApp 後,發送一條語音消息後的回覆。他坦言,當第一次看到模型自己用 FFmpeg 轉格式、調用 API 時,意識到某種東西發生了改變,更是直言“我雞皮疙瘩都起來了”。



(來源:OpenAI)


以下是訪談實錄,DeepTech 在不改變原意情況下做了適度刪減和編輯:


13 年創業後,他被 AI 重新點燃


主持人:Peter,歡迎來到 OpenAI。OpenClaw 項目可謂是火爆全球,並登上全球各大網站和報刊,這可不常見,恭喜你取得成功。你現在感覺怎麼樣?


Peter:坦白說,各方面都有點信息過載讓我有些不適應。我最初啓動這個項目是想激勵大家,這種形式很有意思,我感到很自豪。


主持人:太了不起了。你這一週都在舊金山,參加了一些活動,比如編程黑客馬拉松 Codex Hackathon,還舉辦了專門圍繞 OpenClaw 的活動 ClawCon。


Peter:其實這是社區自發創建的活動。當時大家都說“我們得來線下聚一聚”,所以我建了一個用於組織聚會的 Discord 頻道。結果我到現場一看,來了差不多 1,000 人。他們的創造力、多樣性、熱情都讓我震撼。


那一刻我意識到,原來自己做出了很神奇的東西:這個項目幾周前還根本不存在,現在卻有成千上萬人在應用它,還專程來見我。下週我們還會有 300 多人蔘與,而且這還遠不是全部。我意識到,現在 OpenClaw 確實已經火遍全球了。


主持人:沒錯,能影響到不同文化,真的很厲害。那你和社區的交流怎麼樣?你花了很多時間和社區成員在一起,其中一些人也參與到了你的項目裏。


Peter:感覺很特別。很多人喜歡它,也有很多期待,希望它最終成爲一個非常成熟的產品。但對我來說,很長一段時間它只是我的小小遊樂場。今年我一直都在驚歎它的可能性。如果你是個 builder,現在真的是一個最好的時代。


主持人:你覺得在當下這個時代,真正動手去創造、做一名 builder,最有趣的地方在哪裏?現在這個時代很特別,整個工具鏈都在變,開發者的定義也在變, 似乎任何人都能做出任何東西。


Peter:我剛接觸這項新技術時,每次都能感覺到多巴胺在飆升。以前我寫很多代碼,做對一件事的概率大概只有 30% 到 40%。而現在的體驗真的顛覆認知,因爲我突然意識到:我可以構建任何東西。當然時間依然有限,軟件開發還是充滿挑戰,但速度大大提升了。


主持人:我同意。我們往回倒幾年吧,我第一次知道你的工作應該是 2011 或 2012 年,你做了 PSPDFKit。在外人看來,你實現了每個開發者的夢想:發現一個問題,做出很棒的解決方案,並創辦公司、擴張,然後出售。我相信這段歷程絕對沒那麼容易。


Peter:確實是這樣。我不是某天醒來,突然拍腦門決定“要做一個 PDF 框架”。這其實是一連串蝴蝶效應:從參加諾基亞開發者大會,到朋友有相關需求,再到辦理美國簽證被延期……這些因素推動着我創辦了公司。


主持人:有意思的是,賣掉公司之後,你休息了幾年。那最終是什麼讓你重新出發的?


Peter:在高強度運轉 13 年後,我當時徹底精疲力盡了。經營一家公司並不是一件容易的事情,做創始人也很考驗各方面的能力。關鍵是,第一次創業時,我並不懂得如何緩解壓力。所以整個人燃得太猛,必須停下來減壓。


但我仍然一直關注技術。我看到了早期的 ChatGPT 之類的技術,覺得挺酷,但沒有特別打動我的地方。因爲新技術必須親自上手體驗,僅是停留在看文章階段是感受不到它真正力量的。直到我準備好、內心也有衝動了,我纔想要再做點東西。


和“做什麼”相比,我更清楚“不想做什麼”:我不想再碰蘋果生態了,因爲做了太久,世界也已經向前走了。這意味着必須得走出舒適圈重新開始,從一個領域專家轉到另一個領域,哪怕是術語都很難甚至讓人感到痛苦——明明有一大堆做產品的經驗,卻沒法直接拿來就用。然後,我就想來看看這個 AI 到底是什麼。


真正震撼我的那一刻,是我把之前沒做完、爛尾的項目撿起來。開發者都喜歡有新想法、開新項目,但最難的是把它做完。但這個項目我想繼續做,也想重寫一遍。


於是我把所有內容整理成一個巨大的 Markdown 文件,大概 1MB 多,然後我把它拖進當時的 Gemini Studio 2.5,讓它重寫。它返回了代碼,我直接放進 Claude Code,然後就開始構建了。我接着做別的事,它就在屏幕上連續跑了好幾個小時。後來,它說自己“已經 100% 可用於生產”。我試了一下,就崩了。


之後,我找了一個我少數真的會用的 MCP 工具 Playwright,對它說:把日誌系統做出來,順便檢查一下問題。一小時後,它真的跑通了,還展示了效果。儘管代碼寫得很粗糙,但對我來說,就是那一刻我徹底被點醒了。毫不誇張地說,我“雞皮疙瘩都起來了”,滿腦子都是那些可能性。那段時間我幾乎睡不着,因爲腦海裏炸開了無數我以前想做卻做不到的東西。然後,我就徹底陷進去了。


我沒寫這段邏輯,它卻完成了


主持人:很多人覺得 OpenClaw 是一夜爆紅,但我覺得你故事裏最迷人的地方在於,這其實是你過去 9、10 個月幾十個項目沉澱的結果。看你的 GitHub,有 40 多個項目,其中一半都用在了現在這個作品裏。我也非常想了解你的這段歷程,這些想法和項目是怎麼一步步彙集成 OpenClaw 的?


Peter:實際上,這並不是一開始就有完整的規劃,而是大部分在探索中慢慢完成的。我想要某些還未擁有的功能,便提示 AI 把它們做出來。我先是做了大量實驗直到呈現出原型,那一刻我才真正開竅:這東西太酷了。我用一小時內做出第一個原型,直接把想法變成現實。然後,我稍微轉移了一下注意力在其他項目上,因爲我當時認爲大公司肯定會做類似的東西。到去年 11 月,我做出了幾個版本,但效果還沒有達到很理想。


真正讓我確信的,是在摩洛哥馬拉喀什的短途旅行。當時網絡信號不好,但 AI 助手的好用程度遠超我預期。WhatsApp 在任何地方都能用,我需要拍照翻譯、查電腦裏的資料。我分享給朋友,他們也想要。我還勸他們說:你們別用,都還沒好呢。但這正是產品契合市場的一種信號:如果你的朋友都搶着用一款產品,哪怕你根本沒爲他們特別設計,而只是給技術同行用的,那就可以判斷這事基本成了。


還有個讓我頓悟的時刻,我隨手發了一條語音消息,但並沒有代碼,模型竟然回覆了。我突然想到:我根本沒寫這部分邏輯,按常理推斷這根本跑不起來。這一下子激發了我的好奇心,我就問模型是怎麼做到的,模型說:“你發了一條消息,但只是個沒有後綴的文件,我分析了文件頭,發現是 Opus 音頻格式。我就在電腦上用 FFmpeg 轉了格式做轉錄,後來又發現沒裝 Whisper。於是我找了一圈,發現了 OpenAI API key,再用 cURL 調用轉錄接口,最終拿到了文本。”


這讓我見識到這些模型解決問題的強大能力。從初始目標看,我們開發這些技術的目標更好地輔助完成一些事務,而它展現出來的能力比預期的中更好。這種能力與真正的全能開發者是觸類旁通的:首先得是名優秀的問題解決者,而這剛好和 AI 的能力對上了。



圖丨OpenClaw 工作原理(來源:https://github.com/openclaw/openclaw)


這太不可思議了。這就是給 AI 工具、給電腦完整權限的力量,它們能自己想出解決方案,哪怕你完全沒寫過相關代碼。我當時心想:天吶,它還用了我的 API key,太瘋狂了吧。後來我又一想,不對,把它放在環境中的作用就應該是這樣的。我的聊天機器人就在同一個環境裏,當然能調用,我就是故意這麼設計的。這不是壞事,而是我想要的效果。


我剛把它放出來時也很好奇,總在想:這會帶我走到哪一步?但我也不斷有“原來如此”的時刻:你給它的權限越多、工具和技能越多,它就越驚豔。你甚至可以給它加一個 Vercel skill,讓它建網站、做應用,需要部署時它還能自己搞定。它還會用你的 API key 把 AI 功能加進去。反過來也一樣,你可以直接生成鏈接分享給朋友。這是一種思維層面的升級,而不只是“我自己會寫代碼”。


去年 11 月和 12 月我完全沉迷在這個項目中,雖然當時還在做別的項目,但大部分時間都花在這個項目上面。儘管前期在網絡平臺上反響平平,可我每次給朋友看,他們都想要,我就說:還沒好呢。然後我就想:我怎麼做才能讓大家感受到它有多酷?


所以,我建了個 Discord,把聊天機器人放進去,沒有任何安全防護——因爲還在極早期,連沙箱都沒有,我就是完全開放開發。現在的 OpenClaw 就是這麼來的,邊調試邊讓模型參與,問它:你看到這個工具調用了嗎?如果它回答沒有,那我就會讓它檢查一下自己的源碼,然後做所有的事情。當人們看到它,他們就理解了。


主持人:你在 Discord 裏給了它哪些權限?比如你所有的推文?它現在掌握了你的哪些信息?


Peter:我的推文很多,記憶相關的內容也不少。不過我很快就開始監控,因爲提示詞部分是公開的。但新一代模型表現真的很好。我有一個名爲 mysoul.md 的保密文件,定義了我的價值觀、模型該如何運作、思考,什麼對我是重要的。


很多人都想要這套配置,也有人進來嘗試提示詞注入,貼大段代碼試探,但模型直接回復“我不讀這個”,甚至還會調侃對方,但我還是不太放心。項目發佈後第一天晚上就引發了巨大關注。我把它關掉睡覺,10 個小時後,當我醒來一看,Discord 裏竟然有 800 條消息,而我的 Agent 在一條條進行回覆。


我嚇壞了,趕緊關掉,冷靜下來逐條查看。最後發現它沒做任何惡意的事,也沒泄露我的系統提示。我不是說不可能,提示詞注入確實存在,但沒大家想的那麼容易。總體來說,它的表現符合預期。我犯的一個大錯是:我把服務關了,但忘了我設置了 LaunchDaemons(注:這是 macOS 系統中用於管理系統級守護進程的機制)。


它的作用就是進程崩了或被殺掉後自動重啓,以保證服務穩定。我做 OpenClaw 就是爲了穩定可靠,但當時完全忘了這一點。我殺了進程,結果 5 秒後它又重啓了,而我已經睡了。


現在不會這樣了,我也加了沙箱,模型還很驕傲地把 Mac Studio 稱作“城堡”。我把它放進了一個輕量容器裏,然後問它:你能訪問這個網站嗎?它回覆:“裏面連 cURL 都沒有。”我說:“你能發揮創造力試試看嗎?”於是,它就造了一個 lobster cURL,自己用 TCP socket 寫了個簡易版 cURL 去訪問網站,甚至還調用了 C 編譯器。這太瘋狂了,它的應變能力太強了。


主持人:當然你也遇到了一些挑戰。很多人很關注安全問題,覺得你從第一天就該把一切做得非常穩健,但你這只是個開源實驗項目。


Peter:是啊,每次有人問我:你能把 CEO、HR 或者團隊成員拉進來嗎?我就想笑。我基本上就是在咖啡館裏自己瞎折騰。但你也看到了區別,對吧?這是任何一個人類單靠自己都不可能做到的。我現在有維護者,也收到了代碼合併請求(PR,pull requests),但本質上就算是一年前,這也不可能實現。沒有任何模型能支持一個人做出這種東西。大家甚至都沒意識到這一點。


主持人:很多開發者肯定和我一樣好奇:Peter 怎麼能這麼高產?我今早又看了一眼你的 GitHub,過去一年你有近 9 萬次提交,參與了 120 多個項目。還有個有意思的點:去年年初活躍度還一般,到 10、11 月突然暴增變成深綠色。我很好奇,這中間發生了什麼?


Peter:改變在於換上了 Codex。我覺得每一代模型都在變強,但不只是模型,調度框架也在變好,我對使用方式和工作流的理解也在提升。有些人用傳統方式寫代碼,他們嘗試 AI 並把它叫做“vibe coding”,但我覺得這個詞並不好。這是一項需要時間慢慢磨練的技能,就像你拿起吉他,不可能第一天就彈好,所以體驗會很差。


但如果你用玩樂的心態去學,去適應,慢慢就會有感覺:知道怎麼寫提示詞,大概要多久。如果耗時太長,我就會反思:是不是我哪裏錯了?是架構錯了、思路錯了,還是別的問題?就像寫代碼一樣,你對目標羣體有感知,自然就能融入架構,而不是和系統對抗。


主持人:如果大家想變得像你一樣,你現在的 Codex 工作流是怎樣的?你說過:大多數人把工作流搞得太複雜了。


Peter:其實我一開始也把配置弄複雜了。從接觸這項技術到真正高效使用,確實花了一段時間。很多人卡在搞超級花哨的工作流上,那並不會真正提升效率,只是感覺上更高效。


我後來寫了一篇很有爭議的文章:就把它當成對話。模型不只是結對編程夥伴,它是不一樣的存在。我直接說我想要什麼,而且總會問模型:你有什麼問題嗎?出於一些原因模型總會有問題,但默認訓練它只是解決問題,然後自己做假設,但這些假設不一定是最好的,尤其是當你的代碼庫很新、沒有大量舊代碼時。


“你有什麼問題嗎”是個非常重要的問題。大家沒意識到,模型通常是從零開始的,它不像我們一樣學習,每次新會話都相當於“對這個代碼庫一無所知”,只能搜到你讓它看的局部內容,試着解決問題,通常看不到全局。


Codex 在全局視野上就強很多。我用的方式非常簡單,甚至用不上工作樹(Worktree),基本就是檢出 1 到 10 個目錄,以保持簡單能讓我更專注於真正的問題。我不想處理複雜的分支管理,只專注不同問題。項目變大後,同時做互不衝突的事會輕鬆很多。


主持人:你用 Codex 開發 OpenClaw,它改變了你的工作方式嗎?


Peter:嗯,我嘗試喜歡所有工具。但我對 Codex 的信任度是最高的,它能準確做出我想要的東西,能用的功能非常多。我覺得大家還沒意識到,GPT-5.2 又是一次巨大的飛躍。我到現在還經常被驚豔到,我們可以放手創造了,太不可思議了。大家真的應該去試試。


主持人:你還曾說過,你現在甚至都不怎麼讀代碼了,這帶來了哪些改變?


Peter:大部分代碼都是很枯燥的,把一種數據格式轉成另一種,最終呈現給用戶。所以大部分代碼我都能大致理解它在寫什麼,看一眼流程就夠了。我腦海裏的模型和它實際生成的基本一致。


我以前帶過團隊,手下有很多工程師,你也必須接受:他們不會寫出和你一模一樣的代碼。最終你要優化代碼庫,讓 Agent 發揮最大作用,這和讓人發揮最佳效果不完全一樣。這也意味着要接受:代碼可能不是你理想中的寫法,但我可以引導模型。很多時候結構方式有很多種,通常無所謂。如果出現性能問題,再針對性優化就行。


正如剛剛我們談到的,我對代碼的理解也改變了做開源的方式,現在 OpenClaw 已經有接近 2,000 個 PR。在 AI 出現之前,你必須讀完所有 PR,因爲那是價值所在。但現在我把它們叫作“提示詞請求”而不是傳統的合併請求,因爲 PR 背後的想法和意圖,比代碼本身更重要。


通常來說,由於我對模型的信任度,遠高於一個我從沒聽過、也沒交流過的外部貢獻者,所以我還是會稍微做代碼審查。但每當我看到一個 PR,我問模型的第一個問題是:你理解這個 PR 的意圖嗎?我其實不關心代碼,我關心你想解決什麼問題。


這更像是一個問題:這是我的解決方案嘗試。但很多人還不太會用好 Agent,常常只給出局部解決方案,因爲腦子裏沒有完整系統。最難的是,這個新功能怎麼融入我的整個大系統?這個小修復是不是正確的修復?還是隻是表面修補,底層有架構問題?


只要你用對話的方式溝通,模型其實非常擅長。我會說:現在來構建這個,先告訴我:意圖是什麼,這是最優解嗎?有時模型說是,但大部分時候會說不是。然後我就會一起探索,最好的修復是什麼?這是架構問題,還是消息機制的問題?會不會隻影響 WhatsApp,還是也影響別的工具?我們應該用更通用的方式做資源處理嗎?這是個新功能,我們真的需要嗎?


這些討論有時會持續 10 到 15 分鐘。我習慣用語音,就像和非常聰明的同事聊天一樣,實際上用語音比打字省 token。當我得到滿意的答案之後,我就用一個斜槓命令,比如 /len pr,它會完整執行:創建分支、修改、合併 PR。我想創建一個社區,所以我儘量給貢獻者署名,哪怕整個過程比我自己寫還慢,但我非常感激大家願意參與進來。


未來不會被 AI 淘汰,但會被懂得用好 AI 的人甩開


主持人:對於圍繞着項目的這些貢獻者,你對 OpenClaw 的未來願景是什麼?你會把自己當作個人 Agent 領域的行業標杆嗎?未來可能全球幾十億人都能用得上這類產品。


Peter:我想找到一個平衡點:即便是我媽媽也會安裝,同時又好玩、可黑客化,但顯然這仍然充滿挑戰。大多數開源項目就是下載安裝包,但很長一段時間裏,我的默認安裝方式是 git clone、build、run,源碼就在磁盤中。Agent 就在源碼裏,也能感知自己的源碼。如果你不喜歡什麼地方,給 Agent 一句提示,它就能自己修改,如果實現這會是真正的自修改軟件。


所以,很多從沒給我提過 PR 的人,提的其實都是提示詞請求,因爲他們不太懂如何構建持久化軟件。同時,整個安全行業都在盯着它,這挺有意思,同時也有點讓人沮喪,因爲他們忽略了很多細節。比如我做的 Web 界面,本來是給自己用的。最初是爲了調試,後來美化了一下,但本意只是在自己的可信網絡裏訪問。但因爲它也可以像黑客樂園一樣玩,所以提供了修改的選項。


有些人會用 Ngrok 或者代理。我之所以不做限制是有原因的,但現在有人把它放到公開網絡上,哪怕我在安全文檔裏反覆強調:別這麼做,這不是它的設計用途。然後安全人士就會指出,它沒有登錄限制,沒有公網環境必需的各種防護。


我想說的是,我本來就不是爲這個設計的。但因爲它可配置,就被認爲是最高級安全風險(CVSS 10.0),我對此也有些困擾。但現在我已經請了安全專家,我意識到,我沒法阻止大家用在非設計場景裏。我現在的重點是支持這些使用方式,幫大家別誤傷自己。這就是開源的魅力:人們可以接納它,想出你根本沒想到的用法,這很美妙。


主持人:好的接下來我們從更宏觀的視野來聊聊,不僅是 OpenClaw 這個項目。我們這周和很多開發者聊過,大家都在問:Peter 怎麼能想出這麼多好點子?創造力爲什麼這麼強?


Peter:我不知道有沒有標準答案,可能就是好奇心驅動,也可能是意識到現在做東西變簡單了。就算我找到一個開源項目能解決 70% 的問題,我也會自己做。這在一年前完全不可能,但現在只要提示 AI,代碼就在副屏幕上跑起來,Codex 就能工作。


主持人:很多開發者和工程師還沒真正接受 Codex 和 agentic 工具。你對他們有什麼建議?尤其是剛開始接觸時,是否需要重新思考工作方式和工作流?


Peter:我的第一條建議永遠是:用玩樂的心態去接觸,做一件你一直想做的事。我總說,未來不會被 AI 淘汰,但會被懂得用好 AI 的人甩開。但如果你的內核是“我想創造、我想解決問題”,如果你有強大的自驅力、足夠聰明,你永遠都會很好。對擁抱這些工具的創作者來說,這是最好的時代,帶着好奇心塑造未來,把任何想法變成現實。


主持人:我覺得以此結尾非常棒,非常期待你接下來的作品。


參考資料:

https://www.youtube.com/watch?v=9jgcT0Fqt7U

https://x.com/steipete/status/2025743825126273066

https://x.com/_mohansolo/status/2025766889205739899


運營/排版:何晨龍

Scroll to Top