【導讀】今天,全球大模型進入千萬億Token時代!僅OpenRouter一個平臺,按約每百萬Token1美元粗略折算,對應年化推理支出約10億美元!老黃在GTC大會上提出的「Token經濟學」,這幾天更是刷屏全網。Token,已經成爲AI時代的全新度量衡!
2026年3月,一個足以讓整個硅谷和華爾街失眠的數字誕生了——
就在剛剛,全球大模型進入千萬億Token時代!
OpenRouter宣佈,年化Token用量突破了一千萬億。


一千萬億,這不是什麼天文物理的觀測數據,也不是某個國家的GDP,只是某個AI模型聚合平臺的年化Token吞吐量。
如果你對這個數字沒有概念,我們可以換個算法:
按照目前市場約1美元/百萬Token的平均價格計算,僅僅是一個聚合器背後的推理支出就高達10億美元。
一個平臺,就跑出了10億美元的真金白銀。全球的算力成本,已經進入一個全新階段。
是的,Token正在成爲這個時代的石油。
現在AI已經像電力一樣,通過API接口,滲透進了每一條代碼,每一封郵件,影響着這世界上的幾乎每一個人。
如果說,2023年是模型覺醒的元年,那麼在2026年的今天,我們已經站在了1,000,000,000,000,000這個數字面前。
這是人類文明史上最大規模的智力溢出。
當人們還在討論AI是否是泡沫時,這15個零已經像海嘯一樣,沖垮了所有懷疑論者!


而就在這個數字公佈的前兩天,老黃站在GTC 2026的舞臺上,用近兩個小時的演講,把Token這個詞說了超過70次。
Token,成爲串聯整場演講的錨點和主線。
老黃實際上在爲一個新時代的經濟底座命名。他給它取了個名字:Token經濟學。
隨後短短几天內,「Token工程」「Token經濟學」的概念立馬火爆全網!
英偉達,創造了Token經濟學
Token到底是什麼?
在老黃看來,Token已經不只是一個技術術語,它已經成爲算力單位、信息單位、貨幣單位。
Token,已經成爲一門大生意。老黃的這一判斷,直接揭示了AI產業的底層邏輯——
Token,就是AI時代的核心經濟標尺!
在此之上,全球AI產業的運行規則,或將被重塑。
Token,是信息單位,是AI思考的最小單元。

Token示意圖
小到一次聊天問答,大到一部電影級AI視頻的生成,再大到企業級模型的訓練和推理,所有AI處理的信息都以Token來計量。
它是AI「思考」的原子,是智能經濟最基礎的度量衡。
算力單位,數據中心的新產品
在GTC上,老黃正式提出了「Token工廠」的概念:
未來的數據中心不再存數據、跑軟件,而是生產Token。
你能產多少Token,就決定你能賺多少錢。
不過,功率是硬約束。1吉瓦的機房就是1吉瓦,物理定律不講情面。
於是,現在的競爭核心就變成了,同樣的電費,誰的每瓦Token吞吐量最高,誰的生產成本最低。
這其實跟傳統制造業一模一樣——同樣一條產線,良品率高的贏。只不過「產品」從芯片變成了Token。
老黃在臺上公佈了Token分層定價:
低端約1美元/百萬Token,中端3到6美元,高端工程級45美元,實時交互級150美元/百萬Token。
跨度150倍,速度和質量決定價格。

老黃在臺上亮出的進化曲線,思路很清晰:用極致的軟硬件協同,一代一代碾壓式壓低成本。
Grace Blackwell在每個價格檔位上把吞吐量比Hopper拉高35倍,全新的Vera Rubin再在Blackwell基礎上翻5倍,加上首次集成Groq LPU後在超級檔位再暴漲35倍。
短短兩年,Token生成率從200萬飆到7億,350倍的史詩級跨越。
而當成本降了一個數量級之後,消耗就能再炸一個數量級。

貨幣單位,寫進工資條的新薪酬
這是最炸裂的一部分,也是老黃這次GTC真正引爆輿論的部分。
誰能想到,2024年底ChatGPT Pro推出200美元/月的會員時,大家還在圍觀「哪個大冤種會花這麼多錢訂閱AI」。
到了今天,Token的燒錢速度,從「讓人肉疼」進化成了「讓人心驚」。
老黃在臺上宣佈:
未來英偉達每個工程師都需要一份年度Token預算。
底薪幾十萬美元,我會在此之上再給大約一半價值的Token,讓效率放大10倍。
不僅如此,Token預算也將成爲硅谷新的招聘籌碼。面試的時候工程師會問:我的offer帶多少Token?
當年跳槽看股權、看RSU,現在還得看公司給不給配Token。智元預算(Token),正在從IT支出變成HR支出。
而推動這一切的最大變量,是Agent。
今年1月橫空出世爆火的OpenClaw帶火了整個智能體賽道。
一個配了Claude Opus 4.6的OpenClaw,隨便對話幾輪就燒掉幾百人民幣。

但老黃看到的是另一面。
Agent要跑就要燒Token,燒Token就要買算力,買算力就要預算。
於是Token預算出現在企業財務報表裏。
每一家SaaS公司都將變成AaaS公司——Agentic as a Service。

推理服務商擴產能,雲廠商建智元工廠,SaaS轉型Agent服務,企業給員工配Token預算。從生產到消耗,閉環完整。
信息單位、算力單位、貨幣單位——三位一體。
Token不再是技術參數,而是AI時代的核心經濟標尺。
一個算力中心生產Token,就等於在印鈔。
雲廠商推波助瀾「養龍蝦」,背後也是Token生意。
三臺超算,押注三個時代
Token要生產,就需要工廠。Token要消耗,就需要Agent。
但如果工廠只存在於數據中心,Agent只跑在雲端,這套經濟學就永遠是大公司的遊戲。
而老黃要把它推到每一張桌面上。他的方式很簡單——親自送貨上門。
2016年,首臺DGX-1送給馬斯克領導下的OpenAI。
深度學習剛從實驗室走出來,絕大多數人還在觀望。
老黃押的注:AI有未來。

2024年,首臺DGX H200送給Sam Altman領導下的OpenAI。
ChatGPT席捲全球,Scaling Law當紅,所有人在卷參數、卷規模。
老黃押的注:訓練大基建時代來了,AGI狂飆。

2026年3月18日,GTC主題演講剛過兩天。
老黃扛着全球第一臺DGX Station GB300,敲開了實驗室的門。
這一次,收貨的是Vibe Coding的提出者,是Agentic Engineering的領軍人物,是Token經濟最具象的消費者——Andrej Karpathy。

20 petaflops算力。784GB內存。萬億參數模型桌面直接起飛。
這臺機器需要20安的電流,正是一座放在桌上的Token工廠。
Karpathy接過來,轉手就在X上曬出了合照。
這機器簡直太美了!
他們說有份神祕禮物,還悄悄透露得插20安的電源。
所以我當時就猜到,它絕對夠給力。

這麼猛的桌面超算,Karpathy只用來幹一件事——養龍蝦。
他當場宣佈,這臺怪獸的第一個任務是跑他的OpenClaw智能體「多比之爪」(Dobby the House Elf claw)。
是的,多比已經通過WhatsApp控制了Karpathy的整個房子。
燈、百葉窗、泳池/水療、Sonos音響、安防、暖通空調,全都接管了。

一隻龍蝦,24小時在線,替主人管家。不眠不休,持續燒Token。
龍蝦是Agent,Token是它的生產資料。
從馬斯克到Altman再到Karpathy;從押注AI潛力,到押注訓練大基建,到押注推理落地;
AI算力的重心,正在從訓練迅速轉移到推理。
AI時代,全新的計量體系
而老黃說,這還只是開頭。
有多少Token,就有多少智能。有多少美元,就有多少Token。
2015年GTC,老黃說深度學習將改變一切,臺下大部分是遊戲玩家。
2026年GTC,他站在3萬人面前雙手舉過頭頂握拳,自封智元之王(Token King)。
臺下,全是歡呼。

如今,誰掌握更高效的Token生產能力,誰就掌握了AI時代最關鍵的服務產能。
這也正是雲廠商近期密集押注AI推理基礎設施的底層驅動。
這些以「養龍蝦」爲代表的新型算力租賃模式,背後都是Token服務生意。

中國模型的調用量已躍居全球首位
Token體系的深遠意義,或許不在於它能否成爲「貨幣」,而在於它正在重塑AI產業的定價權與競爭邏輯——
誰能以更低成本、更高效率生產Token,誰就在這場產業重構中佔據上風。
參考資料:HZK
https://www.businessinsider.com/nvidia-ceo-jensen-huang-cant-stop-talking-about-tokens-2026-3
https://x.com/karpathy/status/2034321875506196585
本文來自微信公衆號“新智元”,作者:新智元,36氪經授權發佈。




