2025217星期一 11:42pm

春節檔AI唱主角!國產大模型密集更新 機器人跳秧歌搶奪眼球

由 財聯社 發佈於 熱點

'25-01-29

《科創板日報》1月29日訊(記者 黃心怡)過年放大招!在春節期間中國的大模型技術迎來了一陣密集更新。

今日凌晨,阿里雲通義千問超大規模的MoE模型Qwen2.5-Max 正式上線,Qwen2.5-Max模型是阿里雲通義團隊對MoE模型的最新成果,預訓練數據超過20萬億tokens。在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基準測試中,Qwen2.5-Max整體表現優於DeepSeek V3、Llama-3.1-405B以及閉源模型GPT-4o。

在新模型發佈後,阿里巴巴美股大漲6.76%。而在前一日,通義千問還開源了全新的視覺模型Qwen2.5-VL,推出3B、7B和72B三個尺寸版本。新的Qwen2.5-VL能夠更準確地解析圖像內容,支持超1小時的視頻理解,實現給指定朋友送祝福、電腦修圖、手機訂票等操作。

剛剛暴擊美股的DeepSeek團隊也在1月28日拋出了新模型,兩款多模態框架—— Janus-Pro 和 JanusFlow。其中,Janus-Pro 是一款統一多模態理解與生成的創新框架,是Janus的升級版本,它在圖像生成基準測試中的表現超越了 OpenAI 的 " 文生圖 " 模型 DALL·E 3。並與之前的 Janus 系列一樣選擇了開源。

當下,國內外廠商在開閉源路線上各有側重。比如OpenAI的GPT-4模型採用閉源模式,而Meta選擇完全開源。其餘大模型公司將模型“低配版”開源,更高參數量的模型閉源。

而DeepSeek和阿里雲通義團隊都是開源路線的堅持者。此次DeepSeek的成功也被認爲是開源模型的勝利。

圖靈獎得主、Meta 首席人工智能科學家 Yann LeCun此前表示,對於DeepSeek的成功,其正確的理解應該是:開源模型正在超越專有模型。

LeCun 表示,DeepSeek 之所以這次一鳴驚人,是因爲他們從開放研究和開源(如 Meta 的 PyTorch 和 Llama)中獲益。DeepSeek 提出了新想法,並在他人工作的基礎上構建。因爲他們的工作是公開發布和開源的,每個人都可以從中受益,這就是開放研究和開源的力量。

一位大模型青年學者對《科創板日報》記者表示,開源和閉源路線各有特色,但開源肯定更爲促進行業發展。

雲基礎設施廠商有望受益於這次開源的勝利。這也是阿里雲通義大模型堅持開源路線的原因之一。“通義的開源模型在中文世界的開發者使用廣泛,當開發者使用阿里雲的開源模型,需要把應用部署到線上的時候,就會自然而然地選用阿里雲的服務。”阿里集團CEO吳泳銘曾表示。

除了基礎模型的更新,春節期間,各色AI應用亦成爲了廠商比拼的焦點。百度智能雲曦靈數字人推出了“飛帖賀新春”微信小程序功能,上傳1張自己的照片,即可快速生成數字人拜年視頻。

阿里雲則擔任央視春晚雲計算AI獨家合作伙伴,爲春晚直播提供了雲基礎設施和通義大模型AI技術支持。《在歲月裏的花》、《方的言》、《難忘今宵》等歌曲的舞美畫面均利用了通義萬相的AI生成能力。

阿里雲通義萬相將舞臺畫面瞬間轉化靜態油畫

宇樹科技的人形機器人H1登上了春晚扭秧歌,無疑是當晚最吸睛的舞臺之一。宇樹科技方面介紹,其核心黑科技是AI驅動全身運動控制技術。作爲全球首款能完成原地空翻的全尺寸電驅人形機器人,其最大關節扭矩能達到 360 N・m,還配備了360°全景深度感知技術。

宇樹機器人彩排照片

宇樹科技團隊在春晚合影

今年也是央視第四次開展8K春晚直播, “8K超高清+三維菁彩聲”公共信號全部採用國產裝備完成製作。《科創板日報》獲悉,科創板上市公司當虹科技爲其提供了技術支持,通過“百城千屏”超高清傳播平臺,把8K畫面,呈現在全國上百個城市、近千塊公共大屏。據瞭解,三維菁彩聲是我國具有自主知識產權的音頻標準,已獲得國際電信聯盟(ITU)技術報告認可,成爲與杜比AC-4等並列的音頻標準。

(財聯社記者 黃心怡)

Scroll to Top