
中國的AI戰場在2026年2月進入白熱化階段。就在2月11日,DeepSeek悄然完成了一次震撼業界的升級,將其模型的上下文窗口從12.8萬令牌暴漲至超過100萬令牌,增幅接近10倍。幾乎同一時刻,智譜AI在深夜發佈了新一代旗艦模型GLM-5,參數規模擴展至7440億。兩家中國AI獨角獸在不到24小時內相繼出招,將中國大模型競賽推向了一個全新的維度。
這不是一場偶然的技術競速。當DeepSeek的聊天機器人在多次回覆中證實上下文窗口已突破百萬大關時,整個AI圈都意識到,這家以低成本訓練震驚硅谷的中國初創公司,再次打出了一張王牌。
從12.8萬到100萬:記憶力的指數級躍遷
上下文窗口可以理解爲AI模型的"工作記憶"。令牌是模型處理文本的最小單位,一個令牌可以是一個詞、一個數字,甚至一個標點符號。中文環境下,一個漢字大約對應1到2個令牌。
DeepSeek此次更新意味着什麼?如果按照一個令牌約等於0.75個英文單詞的標準換算,100萬令牌相當於75萬個單詞,大約是托爾斯泰經典小說《戰爭與和平》的全文長度。用戶可以一次性將整本書、完整的代碼庫、數千頁的法律文件或者企業的全部知識庫扔給模型,讓它在不遺忘任何細節的情況下進行分析、總結或推理。
更重要的是,DeepSeek同步將知識截止時間從2024年7月更新至2025年5月,爲系統注入了近一年的新信息。這意味着模型不僅能"記得更多",還"知道得更新"。這種雙重升級在業界極爲罕見,顯示出DeepSeek在技術儲備和迭代速度上的強大實力。
與此前版本相比,12.8萬令牌的上下文窗口已經足夠處理一篇中等長度的學術論文或者幾十頁的商業報告。但100萬令牌的容量則徹底打開了應用想象空間。軟件開發者可以將整個項目的源代碼一次性輸入,讓模型理解代碼架構、發現潛在漏洞、生成測試用例。律師可以上傳案件的全部卷宗,讓AI在幾秒鐘內完成跨文檔的關聯分析。研究人員可以輸入數百篇論文,讓模型提取共性規律或發現矛盾之處。
智譜GLM-5的深夜反擊
就在DeepSeek宣佈升級的同一天深夜,智譜AI正式發佈了新一代旗艦模型GLM-5。時間點的高度重合絕非巧合,這更像是一場精心策劃的反擊戰。
GLM-5的參數規模達到7440億,其中激活參數爲400億,預訓練數據量高達28.5萬億令牌。智譜將這款模型定位爲"Agentic Engineering時代最好的開源模型",強調其在編程與智能體能力上取得了開源領域的最佳表現。在全球權威的Artificial Analysis榜單中,GLM-5位居全球第四、開源第一。
智譜特別強調,GLM-5在真實編程場景中的使用體感已經逼近Claude Opus 4.5,這是Anthropic公司的頂級閉源模型。這一表述極具野心,意味着中國開源模型正在縮小與全球頂尖閉源模型的差距。更值得關注的是,GLM-5已完成與華爲昇騰、摩爾線程、寒武紀、崑崙芯、沐曦、燧原、海光等主流國產芯片平臺的深度適配,這爲其大規模部署鋪平了道路。
GLM-5的核心突破在於從"寫代碼"到"寫工程"的能力躍遷。傳統AI模型擅長生成代碼片段,但往往缺乏對複雜系統的整體把控。GLM-5則能夠理解大型編程任務中的模塊依賴、數據流轉、錯誤處理等工程化要素,這使其更適合企業級應用場景。
技術軍備競賽背後的戰略考量
DeepSeek和智譜的相繼出招,折射出中國AI產業的兩個重要趨勢。
首先是長上下文能力已成爲大模型競爭的新戰場。過去一年,全球主要AI廠商都在瘋狂擴展上下文窗口。谷歌的Gemini 2.5 Pro支持100萬令牌,OpenAI的GPT-4 Turbo支持12.8萬令牌,Anthropic的Claude 3.5則支持20萬令牌。DeepSeek此次直接躍升至百萬級別,意味着它在這一維度上已與谷歌並駕齊驅,超越了OpenAI和Anthropic。
其次是開源與閉源路線的分化。DeepSeek採取閉源策略,通過API提供服務,這使其能夠快速迭代並保持技術領先。智譜則選擇開源GLM-5,試圖通過社區力量加速生態建設。兩種路徑各有利弊,但都在用實際行動證明,中國AI企業已經有能力在全球頂級玩家的牌桌上爭奪話語權。
更深層次的考量在於成本控制與效率提升。DeepSeek此前因用低成本訓練出頂尖模型而震驚業界,其公開的訓練成本僅爲約600萬美元,遠低於OpenAI的數億美元。此次升級是否繼續貫徹低成本路線,將成爲業界關注的焦點。智譜GLM-5與國產芯片的深度適配,則體現了中國AI產業在供應鏈安全與成本優化上的雙重考慮。
從算力競賽到應用落地
百萬令牌上下文窗口的實現,背後是巨大的算力支撐和工程優化。處理如此長的上下文需要海量的顯存和計算資源,同時還要保證推理速度不至於慢到無法使用。DeepSeek和智譜能夠實現這一突破,說明它們在模型架構、注意力機制優化、分佈式計算等方面都有深厚積累。
但技術突破只是起點,真正的考驗在於應用落地。超長上下文窗口在哪些場景中能夠創造實際價值?企業客戶是否願意爲這種能力付費?如何在成本與性能之間找到平衡點?這些問題將決定這場軍備競賽的最終走向。
當前跡象顯示,金融、法律、醫療、軟件開發等領域對長上下文能力有強烈需求。但這些行業對數據安全、結果準確性、響應速度都有極高要求,單純的技術指標提升並不足以贏得市場。誰能率先打通技術到商業的閉環,誰就能在這場競賽中笑到最後。
2月11日的這場雙重突襲,只是中國AI產業競爭的一個縮影。隨着越來越多玩家入場,技術迭代的速度只會越來越快。對於全球AI格局而言,中國力量的崛起已是不可忽視的現實。



