文 | 駱軼航 和他的 Claude Cowork
過去因爲相信所以看見的那個 token,現在不用相信就能看見。它是瓦特、安培、比特之後的下一個。

2009年1月,一個匿名者發明了一種叫 “token”的東西,你投入算力,獲得 token,token在一個共識網絡裏流通、定價、交易。整個加密經濟由此而生。十幾年過去了,人們還在爭論這種 token 到底有沒有價值。
2025年3月,一個穿皮衣的男人重新定義了另一種叫 token 的東西。你投入算力,產出 token,token在一個 AI 推理(inference & reasoning )過程中裏被立刻消費掉:思考、推理、寫代碼、做決策。整個 AI 經濟由此加速。沒有人爭論這種 token 有沒有價值,因爲你今天早上剛用掉了幾百萬個。
兩種 token,同一個名字,同一個底層結構:算力進去,有價值的東西出來。

2026年3月,我坐在 NVIDIA GTC 會場裏,聽了黃仁勳一場幾乎沒有帶貨的主題演講。是的,他發佈了 Vera Rubin,一款 CPU 與 GPU 結合的產品。但這次,他沒有講芯片參數,沒有講製程工藝,他講的是一套關於 token 生產、定價和消費的完整經濟學——
哪種模型,對應哪種 token 速度;哪種 token速度,對應哪個定價區間;哪個定價區間,需要什麼級別的硬件來支撐。
他甚至幫臺下的 CEO 和掌握着企業支票本的決策者們做好了數據中心的算力分配方案:25%給免費層,25%給中端,25%給高端,25%給高溢價層。
是的,這次他沒有具體賣哪款 GPU 組,就像兩年前賣 Blackwell 那樣。但這次,他在賣一些更大的東西。兩個小時下來,我覺得他最想講的一句話其實是:Welcome to consume tokens, and only Nvidia''s factory could produce。
這一刻我意識到,這個男人,和17年前那個匿名者挖出了第一個 token 的人,做的是結構上完全相同的一件事。
同一套轉化規則
化名爲“中本聰”的那個匿名者,在2008年寫了一篇九頁的白皮書,設計了一套規則:投入算力,完成一個數學證明(Proof of Work),獲得 crypto token 作爲獎勵。
這個規則的精妙之處在於,他不需要任何人信任任何人——只要你接受這套規則,你就自動成爲這個經濟體的參與者。這個規則是對的,畢竟它讓那麼多爾虞我詐的人走到了一起。
而黃仁勳在 GTC 2026的舞臺上,做了一件結構上一模一樣的事。
他展示了一張圖,彰顯推理效率與 token 消耗的關係和張力:Y 軸是吞吐量(每兆瓦功耗產出多少 token),X 軸是交互性(每個用戶感知到的 token 速度)。然後,他在 X 軸下面標了五個定價檔:Free 用Qwen 3,$0/百萬token;Medium 用 Kimi K2.5,$3/百萬token;High 用 GPT MoE,$6/百萬 token;Premium 用 GPT MoE 400K context,$45/百萬 token;而 Ultra,$150/百萬token。
這張圖幾乎可以當作黃仁勳 “token 經濟學” 的白皮書封面。

中本聰定義了“什麼是有價值的計算”——完成 SHA-256 哈希碰撞就是有價值的。而黃仁勳定義了“什麼是有價值的推理”——在給定功耗約束下,以特定速度爲特定場景產出 token就是有價值的。
中本聰和黃仁勳都沒有直接生產 token,他們定義的都是 token 的生產規則和定價機制。
老黃在臺上說的一句話,幾乎可以直接寫進 token 經濟學白皮書的摘要——
Tokens are the new commodity, and like all commodities, once it reaches an inflection, once it becomes mature, it will segment into different parts.
Token是新的大宗商品。大宗商品成熟之後會自然分層。他不是在描述現狀,他是在預判一個市場結構,然後把自己的硬件產品線,精確地鋪在這個結構的每一層上。
兩種 token的生產過程,甚至有一個語義上的對稱:挖礦叫 mining,推理叫 inference。
挖礦和推理的本質,都是把電變成錢。礦工花電費挖 crypto token,然後賣掉,推理模型和 AI Agents 花電費產生 AI token,然後按百萬計價賣給開發者。中間環節不同,兩頭都一樣:左邊是電錶,右邊是收入。
稀缺性的兩種寫法
中本聰做過的最重要的設計決策,不是 Proof of Work,是2100萬枚的比特幣總量上限。他用代碼製造了人工稀缺——不管有多少礦機湧入,比特幣的總量永遠不會超過2100萬枚。這個稀缺性是整個加密經濟的價值錨。
而黃仁勳,用物理定律製造了天然稀缺。他說——
"You still have to build a gigawatt data center. You still have to build a gigawatt factory, and that one gigawatt factory for 15 years amortized... is about $40 billion even when you put nothing on it. It''s $40 billion. You better make for darn sure you put the best computer system on that thing so that you can have the best token cost."
一個1GW 的數據中心永遠不會變成 2GW。這不是代碼限制,這是物理定律。
土地、電力、散熱——每一項都有物理上限。你花400美元億建好的這個工廠,15年的生命週期裏能產出多少 token,完全取決於你往裏面放了什麼計算架構。

中本聰的稀缺性可以被 fork。不喜歡2100萬枚的上限,fork一條新鏈,改成2億枚,叫它以太幣或什麼鬼玩意兒,隨你便,順便再發個白皮書。而人們確實這麼做了,樂此不疲。
而老黃製造的稀缺性不能被fork。畢竟你不能 fork熱力學第二定律,不能 fork一個城市的電網容量,不能 fork一塊土地的物理面積。
但無論是中本聰還是黃仁勳,他們創造的稀缺性都導致了同一個結果:硬件軍備競賽。
挖礦的歷史是:CPU→GPU→FPGA→ASIC。每一代專用硬件都讓上一代變成廢鐵。而 AI 訓練和推理的歷史也正在重演:Hopper→Blackwell→Vera Rubin→Groq LPU。通用硬件起步,專用硬件定局。老黃今年 GTC 展示的 Groq LPU,那個收購了 Groq 之後發佈的確定性數據流處理器。靜態編譯,編譯器調度,沒有動態調度,500MB片上SRAM——它架構哲學上就是推理領域的 ASIC。只做一件事,但做到極致。
有意思的是:GPU 在兩波浪潮裏都扮演了關鍵角色。
2013年前後,礦工們發現 GPU 比 CPU 更適合挖 crypto token,英偉達顯卡被買斷貨。10年後,研究者們發現 GPU 是訓練和推理 AI 模型的最佳工具,英偉達數據中心卡再次被買斷貨。GPU 作爲一個處理器門類,先後服務了兩代 token 經濟。
而區別在於,第一次英偉達是被動受益,然後也就沒然後了。而第二次,在 AI 算力消費的主戰場從預訓練切換到推理測的時候,英偉達很快抓住機會主動設計了整個遊戲,成爲 AI 遊戲規則的寫入者。
全世界最賺錢的鏟子
淘金熱裏最賺錢的不是淘金者,是賣鏟子的 Levi Strauss。挖礦潮裏最賺錢的不是礦工,是賣礦機的比特大陸和吳忌寒。AI 預訓練和推理浪裏最賺錢的不是基座模型和 Agent,而是賣 GPU 的英偉達。
但講真,比特大陸跟英偉達置於各自產業的角色,已不可同日語。
比特大陸只賣礦機,英偉達還曾是比特大陸的供應商。你買了礦機,挖什麼幣、去哪個礦池、以什麼價格賣出,都跟比特大陸無關。它是一個純硬件供應商,賺的是一次性的設備利潤。
英偉達不一樣。他不只賣硬件,現在,尤其是2025年推理側 AI 爆發以來,它深度定義了應該用這款 GPU 挖什麼 、如何給 token定價、token 賣給誰、數據中心應該怎麼分配算力…… 這些都在老黃的演講 PPT 裏:他把市場分成五個 tier,每個 tier 對應什麼模型、上下文長度、交互速度和價格……英偉達標準化、格式化了未來 AI 推理驅動一切的市場。
2018年前後,全球算力集中在幾個大礦池——F2Pool、Antpool、BTC.com——它們互相競爭算力份額,但礦機來源高度集中在比特大陸。
一如今天的英偉達,60% 收入來自互相競爭的 “hyperscaler”,例如 AWS、Azure、GCP、Oracle、CoreWeave,而 40%來自分散的 AI Natives、主權AI 項目和企業客戶。大“礦池”貢獻主要營收,小“礦工”提供韌性和多元化。
兩套生態的結構一模一樣。但比特大陸後來遇到了競爭對手——神馬礦機、芯動科技、嘉楠耘智都在蠶食它的份額。礦機是相對簡單的 ASIC 設計,追趕者有機會。而撼動英偉達似乎變得越來越難:20年的 CUDA 生態,數億 GPU 的安裝基數,NVLink六代互聯技術,Groq 整合後的解耦推理架構——英偉達的技術複雜性和生態壁壘,讓大部分的競爭工具都無效了。
這可能得持續20年。
兩種 token 的根本分叉
而讓加密貨幣和 AI 訓練和推理兩種 token 產生本質不同的,是人們使用的動機和心理。
Crypto token 的需求側是投機。沒有人“需要”比特幣來完成工作。所有宣稱區塊鏈代幣能幫你解決問題的白皮書都是騙子些的。你持有 crypto,是因爲相信未來會有人以更高的價格從你手裏買走它。比特幣的價值來自一個自我實現的預言:足夠多的人相信它有價值,它就有價值。這是信仰經濟。
而 AI token的需求側是生產力。雀巢需要 token來做供應鏈決策——它的供應鏈數據從15分鐘刷新一次變成3分鐘刷新一次,成本降低83%,這個價值是可以直接映射到 P&L 上的。英偉達 100%的工程師已經需要 token 來寫代碼而不是手搓;研究團隊需要 token 從事科研。你不需要相信 token有價值,你只需要用它,價值就在使用中自證了。
這是兩種 token最本質的區別。Crypto token被生產出來是爲了被持有和交易——它的價值在於不使用。AI token 被生產出來是爲了被立刻消費掉——它的價值在於被用掉的那一刻。
一種是數字黃金,越囤越值錢;一種是數字電力,生產出來就燒掉。
這個區別決定了:AI token 經濟不會像 crypto token 經濟一樣泡沫化。比特幣大起大落,因爲投機品的價格由情緒驅動。但token 的價格由使用量和生產成本驅動,只要 AI 持續有用——只要人們還在用 Claude Code 寫代碼、用 ChatGPT 寫報告、用 Agent 跑業務流程,token 的需求就不會崩。它不靠信仰,靠的是離不開。
2008年,比特幣白皮書需要反覆一個去中心化的電子現金系統爲什麼有價值。17年過去了,人們還在爭。
2026年,token 經濟學沒有引發任何爭論,它甚至不需要論證就成了共識。老黃站在 GTC 的舞臺上說“tokens are the new commodity”的時候,沒有人質疑。因爲臺下坐着的每一個人,今天早上都用 Claude Code 或者 ChatGPT消費了幾百萬個 token。他們不需要被說服 token有價值——他們的信用卡賬單已經證明了。
從這個意義上,老黃真的是中本聰的副本,那個替中本聰留下來壟斷了礦機生產、定義了 token 的使用場景和使用規範、而且一年一度在聖何塞 SAP Center 舉辦一場 show,告訴人們下一代支持 AI 訓練和推理的“礦機”有多強的那個副本。
中本聰有一種慾望審慎的魅力,他設計完規則,交給代碼,然後消失。這是密碼朋克的浪漫。而老黃比任何科學家都像生意人,他設計了規則,親自維護,不斷添磚加瓦,築牢自己的護城河。
你過去因爲相信所以看見的那個 token,現在不用相信就能看見。它是瓦特、安培、比特之後的下一個。




