除夕重磅!千問開源Qwen3.5,最大吞吐量提升至19倍

由 DeepTech深科技 發佈於 科技

'26-02-16

除夕夜,阿里官宣發佈並開源新一代千問大模型千問 3.5(Qwen3.5-Plus)。這是繼 2025 年除夕發佈 Qwen2.5-Max 後,阿里又一次在除夕帶來新一代模型。


現在,千問 APP 與 PC 端(qianwen.com)已經同步上線,用戶可在頁面頂部選擇模型新一代模型,來體驗千問 3.5 的能力。


去年除夕更新的 Qwen2.5-Max 重點在規模和性能,而這次,千問 3.5 更像是一場從純文本模型到原生多模態模型的底層架構層面重構。



圖丨現在打開千問,已經可調用新模型 Qwen3.5-Plus(來源:千問)


與前幾代的千問大語言模型相比,千問 3.5 這次帶來哪些模型性能的提升呢?


從預訓練來看,千問 3 是在純文本 Tokens 上進行,而千問 3.5 的預訓練則基於視覺和文本混合 token。也就是說,視覺理解不再像從前那樣以外掛模塊形式存在,而是同語言能力共同在底層建模“作戰”。


此外,其還大幅新增了中英文、201 種語言與方語言、STEM 和推理等數據。這意味着,打破了以往的侷限性,而是嘗試讓模型在更密集的世界知識和推理邏輯。


值得關注的是,千問 3.5 以少於 40% 的參數量實現了超萬億的 Qwen3-Max 基座模型的高性能。這背後反應的不是簡單的堆參數,而是效率導向的架構優化。



(來源:千問)


在推理、編程、Agent 智能體等全方位基準評估中均表現優異:


·在指令遵循 IFBench 上,以 76.5 分刷新所有模型紀錄;


·在 MMLU-Pro 知識推理評測中超越 GPT-5.2,獲得 87.8 分得分;


·在博士級難題 GPQA 測評中得分爲 88.4 分,高於 Claude 4.5,但與 GPT-5.2 的 92.4 分和 Gemini 3 Pro 相比仍有進步的空間;


·在通用 Agent 評測 BFCL-V4、搜索 Agent 評測 Browsecomp 等基準中,千問 3.5 表現與 Gemini 3 Pro、GPT-5.2 相比性能更優。



(來源:千問)


總體來看,這種原生多模態訓練,爲千問 3.5 的視覺能力帶來了顯著提升。千問 3.5 在多項權威測評中,均實現了最佳性能,包括多模態推理(MathVison)、通用視覺問答 VQA(RealWorldQA)、文本識別和文件理解(CC_OCR)、空間智能(RefCOCO-avg)、視頻理解(MLVU)等。


可以看到的是,千問 3.5 不再是“語言強、視覺補”,而是在統一架構下形成了一種相對完整的能力矩陣。



(來源:千問)


千問 3.5 之所以能實現性能的顯著提升,離不開性對 Transformer 經典架構的突破。


此前,千問團隊自研的門控技術成果“Gated Attention for Large Language Models: Non-linearity, Sparsity, and Attention-Sink-Free”,獲得全球 AI 頂會 2025 NeurIPS 最佳論文。



(來源:arXiv)


本次千問 3.5 創新的混合架構中已融合該技術,團隊結合線性注意力機制和稀疏混合專家 MoE 模型架構,實現了“高參數、低激活”的結構:模型總參數規模達 397B,但每次推理僅激活 17B 參數。這種結構帶來的好處可能是,模型在保持高性能能力的同時,推理效率大幅度提升。



(來源:千問)


根據千問官網,千問 3.5 通過訓練穩定優化以及多 token 預測等系列技術,實現了 Qwen3.5 性能比肩 Qwen3-Max 模型,並在此基礎上對推理效率進一步提升:在 32K 上下文場景中,千問 3.5 推理吞吐量可提升 8.6 倍;而在 256K 超長上下文中,Qwen3.5 推理吞吐量最大能實現 19 倍的提升。


這意味着,在長文本分析、複雜推理、Agent 調度等場景中,成本和延遲大幅下降。



圖丨千問 3.5 推理效率大幅提升,最大吞吐量提升至 19 倍(來源:千問)


基於優異的視覺能力,千問 3.5 還突破性地實現了從 Agent 框架到 Agent 應用,尤其是在提升操作效率方面。例如,能夠自主操作手機與電腦,高效完成日常任務,在移動端支持更多主流 APP 與指令,在 PC 端可處理更復雜的多步驟操作,包括跨應用數據整理、自動化流程執行等。


同時,千問團隊還構建了一個可擴展的 Agent 異步強化學習框架,基於此端到端可加速 3 到 5 倍,並將插件式智能體 Agent 支持擴展至百萬級規模。這也是標誌千問從對話模型向行動模型過渡轉化。


千問透露,下一階段的重點將從模型規模轉向系統整合:構建具備跨會話持久記憶的智能體、面向真實世界交互的具身接口、自我改進機制。


放眼全球全球的大模型競爭已然不再只是比拼“更大、更準”,而是“更高效、更可執行”。千問 3.5 不僅是一次模型的更新,一場關於模型的效率革命,已經開始了。


參考資料:

https://qwen.ai/blog?id=qwen3.5

https://github.com/qiuzh20/gated_attention


排版:劉雅坤

Scroll to Top