
在智譜率先宣佈開源GLM-5後不到半天的時間裏,MiniMax立馬跟進上線M2.5編程模型。
就在發佈模型的當日,智譜股價開盤大漲,一度漲超25%,周內累計漲幅超過 77%,市值突破1700億港元。
MiniMax同日漲幅一度超過20%,總市值超過1800億港元。兩家公司的股價表現遠超大盤。
這種漲幅在港股AI板塊並不常見。
要知道,智譜在1月8日IPO時,發行價爲116.2港元,當時的市值是518億港元。短短一個月時間,市值翻了三倍多。
此外,智譜和MiniMax選擇這個時間點發布,是有其現實考量。
2月12日正是企業和開發者春節前最後的工作窗口。
此時發佈模型,既能趕在假期前完成技術社區的首輪傳播,又能讓開發者在春節長假期間有充足時間試用和討論。
此前我曾認爲,春節窗口期可能是裹着AI外皮的紅包大戰,歸根結底,比的是紅包的數量和額度。但現在看來,我的推斷是錯的。
AI產業在春節期間,進入了一個“萬模齊發”的盛況。
從1月底開始,阿里的Qwen3-Max-Thinking、月之暗面的Kimi 2.5、階躍星辰的Step 3.5 Flash已接連發布。
隨後在2月8日,阿里千問團隊又向Hugging Face提交了Qwen 3.5的支持代碼,確認新模型即將到來。
字節跳動則計劃在2月14日推出豆包 2.0,並且新的豆包包含了Seedream 5.0和SeedDance 2.0的完整矩陣。
至於DeepSeek的V4版本,其是否會在春節期間發佈仍存疑,但即便不發佈新版本,市場也已經足夠熱鬧。
真正的戰場,在於模型能力本身,紅包退居其次。
花旗銀行曾在1月26日明確指出,2026年標誌着AI助手從技術驗證邁向全民級應用的拐點,春節成爲檢驗用戶習慣養成的關鍵窗口。
誰能在這個長假,用模型留住用戶,誰就能在接下來的一年裏佔據主動,就像2025年的DeepSeek一樣。
01
智譜和MiniMax兩大模型究竟怎樣?
GLM-5的核心定位,是面向複雜系統工程與長程agent任務。
如果說過去的AI編程工具只是幫你寫代碼,那GLM-5想做的,是幫你完成整個系統工程。
智譜將這一模式叫做“agent engineering”,並且表示,這是“vibe coding”的下一階段。
不過這個說法並非空穴來風,前OpenAI聯合創始人兼AI主管安德烈·卡爾帕西(Andrej Karpathy)在“vibe coding”實踐一週年時就曾表示過,開發者的角色正在從“寫代碼”轉向“編排AI agent”。
GLM-5某種程度上是對這一趨勢的回應。
幾周前,開源社區曾流傳一個名爲“Pony Alpha”的神祕模型。它能進行長程交互、拆解複雜任務、在多輪對話中保持穩定上下文,一度引發廣泛猜測。
如今答案揭曉,Pony Alpha正是GLM-5的匿名測試版本。
GLM-5在技術規格上實現了顯著躍升。參數量從GLM-4.7的355B(激活 32B)擴展至744B(激活40B),預訓練數據從23T token增加到28.5T token。
更大的參數規模意味着更強的知識儲備和推理能力,但更關鍵的地方在於GLM-5的兩項創新。
第一項是名爲“Slime”的異步強化學習框架。
這套系統支持模型從長程交互中持續學習,在處理需要數十步操作的工程任務時保持策略一致性。
傳統的AI編程工具往往在短對話中表現出色,但一旦任務鏈條拉長,模型就容易犯錯,前後邏輯出現斷裂。
Slime框架的設計初衷,就是讓模型在長週期任務中保持“記憶”和“目標感”。
第二項是集成了DeepSeek的稀疏注意力機制(DSA)。
這套機制能讓模型在保持長文本處理能力的同時,大幅降低部署成本。
DSA的機制其實很好理解,我舉個例子,當你讓AI分析一個包含數萬行代碼的項目時,它不需要對每一行代碼都投入同等的計算資源,而是能夠識別出哪些是關鍵邏輯、哪些是重複模板。
因此整個模型的運行效率就會提升,整體運行成本也會降低。
根據智譜給出的測試分數,GLM-5在SWE-bench-Verified和Terminal Bench 2.0中分別獲得77.8和56.2,是目前開源模型的最高分數。

着重介紹一下後者,Terminal Bench 2.0是測試模型在命令行環境中的操作能力,比如能否正確執行文件操作、調用工具、處理錯誤。
56.2的分數表明,GLM-5已經具備了相當程度的“動手能力”。
在agent能力上,GLM-5在 BrowseComp、MCP-Atlas 和τ²-Bench 等多個評測基準中取得開源 OTA表現。
特別值得關注的是Vending Bench 2測試。
這是最近比較火的基準。它的要求是模型在模擬環境中經營一家自動售貨機公司,週期爲一年。
它要自己決定進貨、定價、庫存結構、現金流管理,在資源有限的情況下持續優化利潤。
GLM-5在這個測試中,最終賬戶餘額達到4432美元,也就是說其具備一定的長期規劃和資源管理能力,至少比我強。
MiniMax的最新模型M2.5目前在模型界面已經可以選擇調用。
這是一個爲agent場景原生設計的模型,MiniMax官方稱其對標的是 Claude Opus 4.6。
不過與智譜不同,MiniMax官方並未公佈其論文或Hugging Face權重。
M2.5模型激活參數量爲10B,在顯存佔用和推理能效比上具有明顯優勢。
相比GLM-5的40B激活參數,M2.5走的是“小而美”的路線,用更少的參數實現更高的效率。
該模型支持PC、App、跨端應用的全棧編程開發,尤其適配Excel、深度研究(deep research)、PPT 等生產力場景。
從社區反饋來看,MiniMax M2.5在成本效益上保持了該企業一貫風格,便宜、實惠。
有開發者在外網論壇上分享,M2.5在處理日常編程任務時,速度比 Claude Sonnet 4.5快2倍,API成本卻只有後者的8%。
02
它們有何不同?
兩個模型都將編程能力作爲核心競爭力,但技術路徑有所不同。
GLM-5通過更大的參數規模和更強的預訓練數據來實現能力提升,在處理大型代碼倉庫和複雜系統工程方面展現優勢。
它就像一個經驗豐富的架構師,見過足夠多的代碼模式、理解足夠深的系統邏輯,因此能夠在複雜場景中給出更全面的解決方案。
而MiniMax M2.5則通過更高效的架構設計,在推理速度和成本控制上更具優勢。

雖然經驗積累不如架構師豐富,但在常見任務上反應更快、執行更高效。
依我推測,GLM-5應該更適合專業程序員處理複雜的、長時的、系統級任務,比如一鍵克隆Web UI、構建仿真桌面,這些需要深度理解和長程規劃的工程項目。
MiniMax M2.5則更適合全棧開發、跨端應用等生產力場景中表現更好,特別適合那些需要快速迭代、頻繁調用的日常開發任務。
03
股價上漲並非模型
但我認爲這輪上漲並非單純的新模型發佈效應。
智譜除了發佈模型以外,還宣佈了產品的漲價,GLM Coding Plan價格上調30%以上。
智譜在價格調整函中明確表示,此次漲價源於“GLM Coding Plan市場需求持續強勁增長,用戶規模與調用量快速提升”。
爲保障高負載下的穩定性與服務質量,智譜還同步加大算力與模型優化投入。
這個邏輯耐人尋味。
在AI大模型行業,大多數公司都在通過降價來搶佔市場份額,DeepSeek就是如此,以極低的價格衝擊市場,各家紛紛跟進降價。
但智譜選擇了相反的策略,提升產品能力,然後漲價。
但用戶真的願意爲更強的能力付費嗎?
GLM-4.7發佈後,其MaaS平臺的年度經常性收入(ARR)從2000萬元增至超5億元,10個月獲得25倍增幅。
這說明,在AI編程這個細分市場,專業用戶確實願意爲真正能提升生產力的工具買單。
不過,和智譜股價上漲一樣,MiniMax股價上漲的原因,也不全是來自於新模型的發佈。
2月10日,MiniMax獲得了摩根大通的首次覆蓋,獲得“超配”評級和 700 港元目標價,並在當日引發股價一度上漲10.7%。

摩根大通明確指出,MiniMax 2025年前三季度海外收入佔比高達 73.1%,遠超國內AI同行。
因此摩根大通將MiniMax描述爲 “天生全球化”的AI企業,認爲其全球化佈局是核心競爭力。
國際市場中,OpenAI、Anthropic、谷歌的定價方案都遠遠高於MiniMax,這就導致後者的核心競爭力更強。
不僅如此,歐美市場對AI工具的接受度和付費能力,普遍高於國內市場。
MiniMax的這一優勢,在當前的國際環境下顯得尤爲寶貴。
可以預見的是,2026年的春節,註定會成爲中國AI發展史上的一個重要節點。
智譜和MiniMax的同時搶跑,雖然只是這個宏大敘事中的一個小小章節。
但它至少說明了一件事,國產大模型公司已經不執着於比參數和融資規模了,而是真的在琢磨怎麼把技術變成開發者願意掏錢的工具。




