春節檔AI唱主角！國產大模型密集更新機器人跳秧歌搶奪眼球-熱點-今日熱點-聚焦看點

《科創板日報》1月29日訊（記者黃心怡）過年放大招！在春節期間中國的大模型技術迎來了一陣密集更新。

今日凌晨，阿里雲通義千問超大規模的MoE模型Qwen2.5-Max 正式上線，Qwen2.5-Max模型是阿里雲通義團隊對MoE模型的最新成果，預訓練數據超過20萬億tokens。在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基準測試中，Qwen2.5-Max整體表現優於DeepSeek V3、Llama-3.1-405B以及閉源模型GPT-4o。

在新模型發佈後，阿里巴巴美股大漲6.76%。而在前一日，通義千問還開源了全新的視覺模型Qwen2.5-VL，推出3B、7B和72B三個尺寸版本。新的Qwen2.5-VL能夠更準確地解析圖像內容，支持超1小時的視頻理解，實現給指定朋友送祝福、電腦修圖、手機訂票等操作。

剛剛暴擊美股的DeepSeek團隊也在1月28日拋出了新模型，兩款多模態框架—— Janus-Pro 和 JanusFlow。其中，Janus-Pro 是一款統一多模態理解與生成的創新框架，是Janus的升級版本，它在圖像生成基準測試中的表現超越了 OpenAI 的 " 文生圖 " 模型 DALL·E 3。並與之前的 Janus 系列一樣選擇了開源。

當下，國內外廠商在開閉源路線上各有側重。比如OpenAI的GPT-4模型採用閉源模式，而Meta選擇完全開源。其餘大模型公司將模型“低配版”開源，更高參數量的模型閉源。

而DeepSeek和阿里雲通義團隊都是開源路線的堅持者。此次DeepSeek的成功也被認爲是開源模型的勝利。

圖靈獎得主、Meta 首席人工智能科學家 Yann LeCun此前表示，對於DeepSeek的成功，其正確的理解應該是：開源模型正在超越專有模型。

LeCun 表示，DeepSeek 之所以這次一鳴驚人，是因爲他們從開放研究和開源（如 Meta 的 PyTorch 和 Llama）中獲益。DeepSeek 提出了新想法，並在他人工作的基礎上構建。因爲他們的工作是公開發布和開源的，每個人都可以從中受益，這就是開放研究和開源的力量。

一位大模型青年學者對《科創板日報》記者表示，開源和閉源路線各有特色，但開源肯定更爲促進行業發展。

雲基礎設施廠商有望受益於這次開源的勝利。這也是阿里雲通義大模型堅持開源路線的原因之一。“通義的開源模型在中文世界的開發者使用廣泛，當開發者使用阿里雲的開源模型，需要把應用部署到線上的時候，就會自然而然地選用阿里雲的服務。”阿里集團CEO吳泳銘曾表示。

除了基礎模型的更新，春節期間，各色AI應用亦成爲了廠商比拼的焦點。百度智能雲曦靈數字人推出了“飛帖賀新春”微信小程序功能，上傳1張自己的照片，即可快速生成數字人拜年視頻。

阿里雲則擔任央視春晚雲計算AI獨家合作伙伴，爲春晚直播提供了雲基礎設施和通義大模型AI技術支持。《在歲月裏的花》、《方的言》、《難忘今宵》等歌曲的舞美畫面均利用了通義萬相的AI生成能力。

阿里雲通義萬相將舞臺畫面瞬間轉化靜態油畫

宇樹科技的人形機器人H1登上了春晚扭秧歌，無疑是當晚最吸睛的舞臺之一。宇樹科技方面介紹，其核心黑科技是AI驅動全身運動控制技術。作爲全球首款能完成原地空翻的全尺寸電驅人形機器人，其最大關節扭矩能達到 360 N・m，還配備了360°全景深度感知技術。

宇樹機器人彩排照片

宇樹科技團隊在春晚合影

今年也是央視第四次開展8K春晚直播， “8K超高清+三維菁彩聲”公共信號全部採用國產裝備完成製作。《科創板日報》獲悉，科創板上市公司當虹科技爲其提供了技術支持，通過“百城千屏”超高清傳播平臺，把8K畫面，呈現在全國上百個城市、近千塊公共大屏。據瞭解，三維菁彩聲是我國具有自主知識產權的音頻標準，已獲得國際電信聯盟（ITU）技術報告認可，成爲與杜比AC-4等並列的音頻標準。

（財聯社記者黃心怡）