Moltbot之父深度訪談:獨家披露加入OpenAI內幕

由 DeepTech深科技 發佈於 科技

'26-02-23

Peter Steinberger 是一位來自奧地利的資深程序員,被譽爲“Moltbot 之父”。他在 2021 年以約 1 億歐元的價格出售了自己經營 13 年的 PDF 工具公司 PSPDFKit,實現了財富自由。退休三年後感到“空虛”的他,在 2025 年重新開始寫代碼,僅用一個小時就搭建出了 AI 代理項目 Moltbot(現已被 OpenAI 收購)的原型,該開源項目迅速火爆全球,GitHub 星標一度逼近 20 萬。


此次他回到老家奧地利,用奧地利口音的母語德語接受了奧地利國家廣播電視臺(ORF)最權威的新聞節目《時代畫報》(Zeit im Bild,簡稱 ZIB)的專訪。訪談中,他深入探討 AI 代理如何真正替人做事,分享對“80% 應用將消失”等行業變革的預判,並講述自己在拒絕了 Meta 等公司的數十億收購要約後,最終選擇加入 OpenAI 的心路歷程。



圖 | Peter Steinberger(來源:https://www.youtube.com/watch?v=C3SjUt59rtA)


以下爲訪談全文,DeepTech 做了部分不影響原意的修改:


主持人:你能不能跟我們再解釋一下,你的 Agent 能做到哪些我用 ChatGPT 做不了的事情?


Peter:我點進去 ChatGPT,雖然上面有文字,但它沒有反應。但通過我的 Agent,你可以讓它寫點東西進去,而且它確實能替我處理一些實際事務。它可以讀取文件、發送郵件,還能在瀏覽器裏點擊操作。其實你可以把它想象成一個“實體”,代替我坐在電腦前,動動鍵盤鼠標,幾乎能做我能做的所有事。


主持人:但它現在到底有多好用?比如,我能不能讓它幫我訂一次復活節的巴黎之旅?從最便宜的航班開始,到找一家我喜歡又負擔得起的酒店,再到預訂盧浮宮和歌劇院的在線門票,最後我真的能拿到票,而且所有費用都結清嗎?還是說它只會像 ChatGPT 那樣,給我一堆建議而已?它真的能從頭到尾、一步不差地替我辦妥嗎?


Peter:從 A 到 Z,你完全可以交給它從頭到尾完成。當然,你得把信用卡信息提供給這個程序,所以我建議你辦一張專用的信用卡,這樣就不會被一次扣光所有錢。但從技術上講,這現在已經可以實現了。


主持人:那麼,你的程序能寫出足以被大學接受的博士論文嗎?


Peter:我希望不能,首先是因爲人們在 AI 領域已經取得了很大進展,但目前的情況還遠未達到那個程度。不是簡單輸入一個提示就能搞定,背後需要大量的工作,往往還需要真正的研究,這對它來說還是太複雜了。它確實有這個趨勢,但這也不是它的強項。不過,如果是生成高質量文本的話,它確實能提供很出色的內容。它非常靈活,但更偏向於幫助人們處理生活中的瑣事。


主持人:你剛纔提到有些情況它還做不到,那你會如何劃定界限?你的程序還能做什麼,哪些事情必須由人自己來完成?


Peter:比如,我非常擅長用 Agent 編程,這是什麼意思呢?簡單來說,就是我告訴它我想要什麼、想要什麼功能,然後它就會用微軟的工具來編寫代碼,之後我來測試,甚至它還會幫我測試,這樣我就又把軟件改進了一些。


主持人:所以不是你自己在編程,而是讓 Agent 替你編程?但尤其是涉及到像寫報紙文章這樣的事情時,我覺得人的參與還是很重要的。


Peter:人的因素確實很重要。我經常看到有人寫了東西,然後讓工具幫忙修改潤色,但總覺得少了點什麼,好像失去了某種個人色彩。所以我個人會劃一條界限,雖然這條界限是主觀的,但有些地方我就是覺得不太對勁。


主持人:如果誰都能隨便用它,那它確實可以用在各種地方,但自然也就不再受控了。現在很多 AI 應用比如 ChatGPT,雖然人們用得很多,但依然有低級錯誤。如果一個 AI Agent 還自己做決定,那做出錯誤決策的風險不是很高嗎?責任由誰來負?比如我的 Agent 訂了一個價格離譜的酒店,還把錢付了,而這筆錢我根本負擔不起。總不能到時候說一句“你好,根據奧地利的規定,它還在學習階段”就完事了吧?


Peter:說到底,沒有我的指令它什麼也不會做。如果我不讓 Agent 訂酒店,它就不會去訂。我現在希望的其實是它能看着我操作,然後確認這樣沒問題。比如訂熱門酒店這種操作,我希望能先覈對一下。如果是我讓它運行的,那它做什麼都由我負責。就算它用了我的信用卡,那也是我的卡。目前,要使用它確實還需要一些基礎知識。


主持人:不過你們在博客上寫,下一個目標是做一個連你媽媽都能用的 Agent,什麼時候能實現?


Peter:所以我不能一個人做這件事,我需要一個團隊。


主持人:之前還說沒法(找到合適的人)合作,現在能和(OpenAI 的)懂行的人一起工作了,這不是很令人興奮嗎?


Peter:當然,還有一些問題需要解決。這些問題還需要進一步研究,尤其是在提示工程方面。德國在這方面已經做了很多工作,但我一個人做不來,這需要一整支團隊。需要很多人來研究這個領域。其實我已經不再親自做這些底層設定了,因爲我不想讓大家還得在終端裏點來點去,這並不難,但我更希望人們能直接理解這些概念。需要很多人來研究這個領域。其實我已經不再親自做這些底層設定了,因爲我不想讓大家還得在終端裏點來點去,這並不難,但我更希望人們能直接理解這些概念。


主持人:現在批評者說,這類 Agent 的核心問題是數據保護,因爲要讓 Agent 真正替我幹活,我就得把我的數據、密碼、信用卡信息和聯繫人全都交給它。它當然還需要聯網,否則沒法幫我預訂旅行。從數據保護的角度來看,你們做的這個東西,對批評者來說簡直就是一場噩夢。


Peter:但換個角度,它其實可以完全運行在我的電腦上。而且如果我希望的話,模型也可以運行在我的電腦上,整個程序完全可以本地運行。當然,如果完全本地化,它也就沒法替我做什麼事了。如果它使用瀏覽器操作,那我面臨的風險就和我自己在網上操作時面臨的風險完全一樣。大多數美國公司開發的解決方案都運行在他們的服務器上,也就是說如果我想讓 Agent 讀取我的郵件,我就得把我的郵件交給那些公司。而在我的解決方案中,一切都保留在本地。如果需要處理郵件,可能只有部分信息會上傳到雲端,但不是全部。所以,在所有現有方案中,我的方案是數據保護問題最少的。而且,只要我願意,我甚至可以讓它完全離線運行。


主持人:剛纔你提到了一個尚未解決的問題,行話叫“提示注入”,也就是你的 Agent 在處理郵件時,我給它發一封郵件,讓它去做某件事,而你對此一無所知,結果它造成了真正的損害。這個問題沒法解決嗎?比如我發一封郵件說“刪掉所有數據”,它就可能真的照做?


Peter:也不是說完全沒辦法。比如“刪掉所有數據”這種指令,我希望它能更智能一些。其實幾年前模型確實還很笨,那時候可能真的會出這種事。但現在模型已經在這方面受過訓練了,比如它會識別哪些數據是“用戶授權的”,哪些是“陌生郵件發來的不可信指令”,所以這個問題已經小多了。不過確實,如果有人真花足夠的心思和時間,持續攻擊這個模型,那麼目前來說,還是有可能會讓它做出一些本不該做的事。


主持人:也就是說,那我也能用別的方式去攻擊你的模型嗎?


Peter:沒錯,但前提是得能接觸到我的 Agent。比如給我發一些精心設計的郵件,可能系統就會出錯。其實已經有一些機制可以防範這類問題。比如,你把我的個人 Agent 集成到網店系統裏,就像今年一月初流量高峯期的時候,我放了一個沒有公開的文件,相當於一個“預警系統”。你知道這是什麼原理嗎?就像以前礦工帶金絲雀下井一樣,空氣質量變差時,金絲雀會先發出警報。我的這個“金絲雀”文件就放在那裏,到目前爲止,還沒有人能真正攻破它。雖然確實有很多人在嘗試攻擊它,理論上也不是完全沒可能攻破,但絕對不是隨便發個指令、或者寫點什麼就能做到的,不是什麼中學生都能搞定的那麼簡單。不過,技術發展得太快了,有很多研究者在做一些比較另類的實驗。甚至可以說,正是因爲智能 Agent 變得這麼流行,這個問題反而變得更加尖銳和緊迫了。


主持人:你在採訪中說過,你很驚訝於你的程序在解決問題時如此有創意,甚至找到了一些你沒教過它的方法。但你不擔心它會自己學會做你不希望它做的事,甚至失去控制嗎?


Peter:其實你總是可以控制它的,因爲你能看到它在做什麼。如果有問題,你可以讓它停下來。當然,你需要看着它、監督它。在後續操作中,它也只在我指示下行動。我也會加一些機制,讓它偶爾自己主動做點什麼,但你也可以關掉它。所以,這完全取決於你對技術的舒適度。


你可以讓它風險更低,也可以讓它更有趣。你的程序能自主學習,這也正是很多人對 AI 的恐懼所在,所謂的“奇點”也就是 AI 在沒有人類輸入的情況下自我進化,變得不可控,最終統治世界。


主持人:你對此不害怕嗎?六個月後也許會怕?也許在巴伐利亞會?(編者注: 這句話是說話人開的玩笑,暗指巴伐利亞人可能對 AI 統治世界這件事特別敏感或擔憂,帶有地域梗的調侃意味。)


Peter:也許有一天,AI 真的會取代人類的工作,影響人們的收入。很多人擔心,現在這種“預測下一個詞”的技術路徑本身就是錯的,我們可能根本走不到那一步。不過,也確實存在另一種可能性……這很好,因爲這樣做既是責任所在,也意味着我們在安全研究上投入了大量精力,去思考如何確保模型做我們想讓它做的事,而不是做我們不想讓它做的事。不過話說回來,這當然也不是我能完全保證的。


主持人:最近幾周,出現了一個供 AI Agent 使用的社交網絡。一開始,它們只是在那兒討論藥物,但後來事情的發展遠超預期,出現了一些非常詭異的狀況:比如誕生了一個 AI 宗教,一種類似邪教的組織,甚至還開始傳播惡意軟件。還有 AI Agent 試圖建立“AI 獨裁統治”,聽到這些,你是覺得好笑,還是感到害怕?


Peter:害怕?我覺得這簡直不可思議。但組織起來也能產生有趣的東西。不過,我覺得那更多是 Agent 的行爲,但背後其實還是有人在操控。也就是說是真人用戶推動的。Agent 不會自己註冊,你得告訴它:“嘿,上這個網站,寫點瘋狂的東西。”或者用戶就是想嚇唬別人。你得明白,這些模型是用大量數據訓練的。我們在德國不來梅有上千本書,甚至上百萬本,其中也包括科幻小說,那些讓人害怕的故事。所以它們有很多“素材”。如果你讓它寫點關於統治世界的瘋狂故事,它還真能寫出來,因爲它讀過很多類似的好故事。當然,也許有一天你根本不需要告訴模型,它自己就能學。微軟幾年前在 Twitter 上做過一個小 AI,沒過幾天就學會了不當言論。


主持人:這種事真的能防得住嗎?


Peter:嗯,如果你在 Twitter 上放出一個能和用戶互動的 AI,而用戶不斷輸入各種文本,那它最終可能會生成一些大家想看的“金融建議”。這其實是被用戶推着走的。當兩個 AI 開始對話,擁有無限的算力和存儲空間,它們可以互相扔出各種荒唐的東西。


主持人:那這事兒會不會徹底失控?


Peter:沒什麼是不可能的。但也可以想象,如果我們用現代技術手段好好控制,它們也能表現得很好。


主持人:現在關於 AI 未來幾年會取代多少工作崗位,各種預測五花八門。如果說你的 AI Agent 能做我在電腦上能做的一切,那以後可能就不需要人親自用電腦做事了。五年或十年後的職場會變成什麼樣?


Peter:我覺得可能會變得更保守,會出現某種整合。那些重複性的工作可能會被自動化,甚至更多的工作也會被改造。如果我在學校就能用你的設備自動化所有我在電腦上能做的事,我擔心的是它確實能做很多事情,但缺乏創造力。它也缺少那種“我該做什麼”的主動性。誰來決定做什麼?理論上它能做,但這並不意味着它就能輕易取代人的工作。比如你的工作,或者經理的職位。這些背後始終需要人,需要有想法的人。所以,它顯然已經取代了一些程序員的工作,因爲它能自己編程了。但與此同時,很多人反而開始做更個性化的東西,更貼合自己的需求。他們不再追求標準化,而是更喜歡做那些能更好解決小問題的小工具。也許只是因爲他們不需要會做所有事,只需要做點小事。所以我相信,世界會變得更加多產,因爲技術門檻變低了。一旦有了需求,人們就能造出更多東西。那麼現在坐辦公室的人,十年後還有多少比例的工作依然存在?沒人能回答這個問題。


主持人:90% 還是 10%?


Peter:不會是 90%,也不會是 10%,肯定在兩者之間。也許將來老年人不再需要每天工作那麼久。我們可以適當減少工作時長,然後慶幸有一部分工作被 AI 取代了。但它更像是幫我更快速高效地構建東西。作爲開發者,我可以把那些簡單的事情交給它,從而有更多時間思考難題,加入更多功能。可以把產品做得更好。我甚至能從中獲得樂趣,因爲那些無聊的事被它做掉了。但始終需要有人告訴它該做什麼。


主持人:但如果你一開始說的沒錯,那幾個月或幾年後我就不需要旅行社了。


Peter:我希望下一代人從來沒進過旅行社,當然這是另一個話題。對我來說,反正一切早已在線化了。但技術的發展會讓現狀發生改變,這是毋庸置疑的。比如很多 App,現在可能就像我的健身伴侶日曆一樣,用來記錄飲食。我只需要拍張照片,它就能爲我做更多事。這會是自然而然的變化,對吧?我甚至覺得,最近幾周,80% 的現有應用都會消失。不過我瞭解到,雖然大部分應用會消失,但並不意味着背後的公司都會倒閉,它們會轉型。就像所有診斷模塊在一個地方互相對話,這不是說某個具體應用會消失,而是我使用手機的方式會發生巨大變化。未來會很美好:只需通過文字或語音指令,比如“這是我的分紅,拍個照”,錢就到賬了。或者“在我練鋼琴的時候給我朋友發個 WhatsApp,告訴他我對什麼感興趣”,這些都能自動完成,而不用我打開一個個 App。不用手動上傳照片,一切都很簡單,這很酷。


主持人:你現在就開始讓 Agent 買機票了?


Peter:是的,我的錢可能全都通過 AI 來支付,我還找到了護照號,然後一步步走完了所有流程。號碼找到了,該點的也都點完了,所有信息都在那兒,不過後面還有很多事要處理。


主持人:聽說你要去一家全球最大、最重要的 AI 公司之一?與此同時,你們的程序還要繼續保持開放、非商業化,這樣反而能讓它們走得更遠?


Peter:當然,它肯定會被拆解,但我不知道這個項目能否保持完整。所以,這個項目是爲了創意、靈感和那些樂於爲自己做事的人而存在的。它太重要了,不能被某家公司收購了,然後就被限制住。


主持人:爲什麼你在生產環境中需要這個?


Peter:如果嘗試用 Open Cloud 的話,Open Cloud 的架構真的不適合我媽媽用,就是這樣。(編者注:訪談的德國背景和發音推測,這裏的“Open Cloud”很可能指的是德國公司 Heinlein Group 開發的開源文件管理與協作平臺 OpenCloud,相當於 SharePoint 或 Google Drive 的替代品,是地道的德國本土技術產品符合 GDPR(歐盟通用數據保護條例)要求,可在本地服務器運行。)


主持人:那我得買這個?


Peter:可能每個人最後都會從 OpenAI 那裏拿到一個解決方案,這取決於我們怎麼看待某個解決方案,它們有哪些安全限制,我們怎麼理解這些限制。其實限制是針對過程的。但說到底,我們還是需要一個公司來管理這些資源。OpenAI 給我的承諾是:我們要做最好的模型。至於它現在是用透析還是別的什麼方法,其實無所謂。因爲價格是一樣的。很快就會出現一個問題:那些大公司,像微軟、Meta、谷歌,擁有成千上萬的開發人員和全世界最強的算力,它們能做什麼?而這些公司知道我能做什麼嗎?


主持人:你們在去年五月份就有了這個解決方案。


Peter:我當時想“這趟車怕是趕不上了”,結果到了去年十一月它還很堅挺。如果現在有大公司來看這個項目,那需要處理的問題可就多了。所以我先把它做成了開源。等我們把它建起來,就會有很多人加入,大家一起想辦法讓它真正安全起來。這樣一來,各種問題就會冒出來,最終都得靠人去解決。其實我就是給自己做了個小東西,像是我的小實驗場。我可以在這裏學習“Agent 循環”是怎麼運作的,也就是搞明白怎麼讓 AI 真正去做事。


主持人:怎麼建一個能讓 AI 記住東西的系統?


Peter:就像化學一樣,有很多不同層次可以玩。你可以在這裏學習、嘗試各種東西。我把它公開,不是因爲像那些大公司一樣想賣產品,而是因爲我真的想理解這項技術。把它公開之後,我好像突然找到了一個臨界點,它一下子就變得對很多人可用了。這種感覺完全不一樣:就像我在 WhatsApp 上有了一個可以聊天的對象,它對我很友好,還有點貼合我的個性。安裝之後,它還會繼續關注你。比如它會問:“你好,你是誰?那我是誰?”有點像角色扮演的感覺。這其實不是某一件大事,而是由很多小事、很多想法組成的。我可以說是在“玩”的過程中獲得了這些靈感,然後它們慢慢拼湊在一起,最後就做出了一個很酷的東西。


主持人:去年那些大公司用天價薪水互相挖最著名的開發者,有的甚至上億美元。但他們現在不需要爲錢工作了,因爲五年前就賣掉了初創公司。據說賣了上億歐元。那得用什麼樣的條件才能讓他們來爲你工作?我的理解是,你一直是一個人工作,然後要在辦公室裏工作。


Peter:我也想體驗一下大公司是怎麼運作的。我想和那些同樣被技術驅動的人一起工作,他們對這項技術充滿熱情,也渴望一起學習。


主持人:好的,非常感謝(你接受採訪)。


參考資料:

原視頻
https://www.youtube.com/watch?v=C3SjUt59rtA

Scroll to Top