行業觀察|中國手機大廠都在做AI,vivo解法有何不同

由 財經雜誌 發佈於 財經

'26-03-29

胡柏山提出,手機正從Smart Phone走向Agent Phone,這一進化有望激活存量市場,帶來新的增長空間


文|黃思韻

編輯|謝麗容


供應鏈成本持續上行、存儲等核心器件價格大幅攀升,疊加換機週期延長,手機廠商正面臨近年來最嚴峻的成本壓力。

除了被迫調價,手機行業還能如何破局?

3月25日,vivo總裁、首席運營官、vivo中央研究院院長鬍柏山在博鰲亞洲論壇期間提出,手機正從Smart Phone走向Agent Phone,這一進化有望有望激活存量市場,帶來新的增長空間。

在vivo看來,未來的手機將不再是被動等待指令的工具,而是一個能看見、能思考、能行動的“數字夥伴”。

這一次,vivo押注的是影像+AI雙核驅動的價值重構。

vivo的路徑是立足端側AI,通過軟硬件深度結合構建差異化,同時以影像能力作爲感知物理世界的核心入口,並將技術邊界延伸至家庭機器人與IoT生態。在成本壓力倒逼全行業的當下,vivo依賴的不是短期提價,而是用AI驅動的價值增量。

今年年初,vivo將“感知賽道”設立爲內部重要的一級支撐技術賽道,致力於將視覺、聽覺、觸覺等,通過傳感器結合大模型,轉化爲機器能理解的物理世界信息。胡柏山評價,企業選擇建立怎樣的感知系統,決定了它要解決用戶什麼場景的問題,進而決定了它能沉澱下怎樣的物理世界數據。

“未來最大的差異化在於場景數據,不在於模型。”胡柏山給出了一個明確結論。

成本和存量競爭壓力倒逼手機行業重新思考增長邏輯,幾乎所有核心廠商都把答案指向AI。胡柏山稱:未來十年,智能手機依然會是人機交互的絕對主導載體。手機將不僅是通訊工具,更是AI落地的“第一現場”,成爲物理世界的感知樞紐與個人數字大腦。

vivo的獨特之處在於兩點。

其一,從戰略取捨視角,它是“差異化從何而來”的底層判斷。基於“未來最大的差異化在於數據,不在於模型”的戰略判斷,vivo選擇不在模型參數上盲目競賽,而將資源押注在“感知賽道”——用影像能力構建物理世界的理解系統,用端側模型沉澱用戶場景數據。這不僅是技術的選擇,更是戰略的取捨。

其二,從戰略縱深視角,vivo的野心不止於手機。從端側模型的小型化,到“感知賽道”的佈局,再到機器人Lab的成立,vivo正在構建一條從Agent Phone到機器人生態的技術縱貫線。誰能在感知層面沉澱下更深的護城河,誰才能在AI時代的終端競爭中真正勝出。

vivo總裁、首席運營官、vivo中央研究院院長鬍柏山 來源:vivo

數據即壁壘,押注端側的邏輯


端側AI的核心價值在於:本地計算帶來低延遲、高隱私、弱依賴,但其真正的護城河,是場景數據。當各家都能調用同樣的大模型時,誰能在端側沉澱更深、更細、更貼合用戶場景的數據,誰才能真正構建差異化。

這正是vivo作爲全球TOP4出貨量終端廠商所擅長的。

生成式AI正加速向終端側滲透。互聯網巨頭、硬件廠商、車企、初創公司,各路玩家殊途同歸——把大模型裝進更貼身的設備,搶佔下一代移動生態的入口。

手機是這場入口爭奪戰的核心載體。胡柏山判斷,手機行業擁有全球數十億級的用戶入口,是用戶7×24小時AI體驗的全天候載體,也是爲數不多能夠統籌芯片、算法、系統、應用、服務這五個環節的產業角色。

但入口在手,不等於壁壘自成。vivo AI副總裁張飛提到當下行業痛點:手機各大數據分散在各種App裏面,用戶在做跨場景任務時成本極高。數據是AI的燃料,卻被鎖在應用孤島裏,難以被調用、整合、轉化爲智能。

這是vivo選擇“把模型做進端側”的底層邏輯——不是在雲端替用戶處理數據,而是在本地構建一個能理解、能整合、能行動的數字中樞。

端側AI的核心價值在於:本地計算帶來低延遲、高隱私、弱依賴,但其真正的護城河,是場景數據。當各家都能調用同樣的大模型時,誰能在端側沉澱更深、更細、更貼合用戶場景的數據,誰才能真正構建差異化。

第三方數據機構弗若斯特沙利文預測,全球端側AI市場規模將從2025年約3219億元增長至2029年1.2萬億元,年複合增長率達39.6%。這意味着,市場夠大,賽道夠長,不過參與者衆多——AI手機、可穿戴設備、智能家居、人形機器人,每一片海域都擠滿了入局者。

近兩三年,國產主流手機廠商都在瞄準AI手機這一入口,各自打造系統級智能體,試圖搶奪高端手機市場份額。路徑大致分兩類:一是自研垂類大模型,如vivo爲其系統助手“藍心小V”引入了藍心大模型;另一種是接入外部大模型,如2025年年初多家手機接入DeepSeek。

問題在於,當各家都能接入大模型的能力時,純軟件層面的AI優化很難形成真正的壁壘。大模型是“智商”,可通過合作或自研獲得;場景數據是“閱歷”,則需要自己長期積累。胡柏山在羣訪中點明要害:軟硬件深度結合,才能打造真正的差異化。他進一步判斷,相較於模型,基於用戶場景的AI能力積累纔是最有差異化的核心競爭力。“這個方面我們肯定是要幹,不做肯定不行。”

vivo的破局點由此清晰:立足端側,用軟硬構建場景數據護城河,形成差異化。

在模型層,2025年vivo開發者大會,vivo副總裁周圍曾宣佈,vivo構建了全球首個專爲端側Agent(智能體)構建的3B(30億規模)模型,該端側模型在語言外還具備多模態、推理、長文本、面向UI Agent等五大能力優勢。

小型化,是爲了在端側跑得更快、更省、更穩。

在硬件層,針對傳統SoC芯片在處理端側模型時帶寬不足、散熱受限等物理瓶頸時,vivo已經在兩年前就開始佈局定製專用的算力芯片,再匹配上端側算法,這有助於支撐相機、會議、出行、遊戲等端側Agent場景的爆發。

芯片自研,是爲了不讓算力成爲場景數據沉澱的瓶頸。

從模型到芯片,vivo的端側佈局環環相扣。表面看是技術競賽,底層邏輯卻是場景數據戰爭——誰能在端側沉澱更深、更細、更貼合用戶場景的數據,誰就能在AI時代的終端競爭中構建真正的護城河。

vivo連續五年亮相博鰲亞洲論壇 來源:vivo

影像爲“眼”,做實差異化錨點


如何讓消費者在手機漲價週期仍然願意買單,這是擺在各大手機廠商面前的難題。vivo的答案,是其最大的長板——影像。

影像能力是vivo過去十年在手機市場立足的根基之一。從自研影像芯片到蔡司光學共研,vivo構建了一套覆蓋光學設計、硬件製造、算法調校的完整技術體系。這套體系在消費者端逐步形成了如今其X數字系列旗艦產品“專業V單”的心智認知——影像領先是其高端化進程中少有的可量化品牌資產。

現在,影像的戰略價值正在被重新評估——它不再只是拍攝工具,而是Agent Phone感知物理世界的“眼睛”。在vivo的影像+AI戰略規劃中,AI大模型是“大腦”,影像能力是“眼睛”。胡柏山點明:AI下半場的決勝點,不在於模型參數,而在於對物理世界的感知與理解。影像能力與Agent體驗的疊加,將構成產品除外觀設計之外最大的差異化因素。

這意味着,vivo過去十年積累的影像能力,正在從“功能賣點”升級爲“戰略資產”。

即將發佈的vivo X300 Ultra和X300s,是這一邏輯的一次商業化試水。其影像Agent,能夠根據環境理解自動推薦構圖與功能——從“看懂畫面”到“作出判斷”,本質上是從感知能力向決策能力的躍遷。同樣的邏輯正在向X Fold系列(辦公與出行)和iQOO系列(遊戲)複製。

不同產品線的差異化Agent佈局,折射出vivo試圖將感知能力適配到高頻場景的清晰思路。

從商業邏輯看,這一路徑有其合理性。一方面,vivo在影像領域的長期投入形成了技術壁壘,這是多數競爭對手短期內難以複製的。另一方面,胡柏山反覆強調的“未來最大的差異化在於場景數據,不在於模型”,影像Agent的價值,恰恰在於它能在用戶最自然的操作鏈路中完成場景數據採集——什麼時間、什麼地點、什麼構圖、什麼場景,這些數據是模型訓練無法替代的“燃料”。

從戰略意圖看,vivo正在嘗試一條從硬件廠商向“感知數據平臺”演進的路徑。用影像構建物理世界的感知入口,用端側模型沉澱場景數據,用Agent能力放大體驗價值——這套邏輯如果跑通,將支撐其高端化戰略,並在AI時代的終端競爭中佔據有利身位。

在元器件價格上漲和市場增長趨緩的背景下,手機廠商已經很難再依靠出貨量擴大規模,利潤空間被不斷壓縮。多位手機廠商相關人士表示,在當前供應價格壓力下,行業普遍只能“向上卷”,通過高端機型提升溢價空間。

但戰略邏輯的成立,並不等於商業落地的必然。vivo接下來要繼續解決三個挑戰。

其一,消費者是否願意爲“Agent能力”買單,尚待市場驗證。影像功能是顯性價值,用戶能直觀感知“拍得更好”;Agent能力是隱性價值,其體驗提升需要時間沉澱。如何在漲價週期中讓消費者爲“看不見的智能”支付溢價,是包括vivo在內的所有廠商都要回答的問題。

其二,從感知到決策的能力躍遷,技術成熟度仍是變量。影像Agent的核心在於“理解”而非“識別”,這需要模型在端側具備足夠的推理能力,同時保持低功耗、低延遲。vivo已佈局定製算力芯片和3B端側模型,接下來要保障大規模商用後的穩定輸出能力。

其三,競品並未缺席。其他手機廠商同樣在推進AI與影像的融合,且各有技術積累。vivo雖然影像領先,但對手在算法、生態、渠道等方面也不甘示弱。當所有廠商都在講“影像+AI”的故事時,vivo能否真正形成差異化認知,取決於其技術落地速度與用戶痛點場景體驗提升。

沿途下蛋,能力複用的長線命題


Agent Phone之外,vivo正在把技術邊界穩步拓展至多場景智能生態,向生態型科技平臺企業邁進。這其實是其技術體系的自然延展。

vivo在2025年成立機器人Lab,重點佈局機器人的“大腦”和“眼睛”,並將家庭場景作爲長期方向。胡柏山在博鰲論壇羣訪中解釋:手機連接數字世界,機器人連接物理世界,兩者最終可能形成統一的技術體系。

這一判斷背後,是vivo對未來技術結構的理解:AI與機器人分別代表數字世界與物理世界最核心的技術方向,而手機憑藉最廣泛的用戶基礎和數據入口,可能成爲連接兩者的中樞。

從商業邏輯看,vivo的機器人佈局有其內在必然性。

圍繞這一目標,vivo正在加強影像與感知能力的佈局,通過視覺系統構建對物理世界的理解能力,並逐步向IoT設備和機器人延伸。這套能力在手機上的應用場景是拍照與影像,但其底層邏輯——對光線、空間、動作、場景的理解與判斷——同樣適用於機器人。也就是說,vivo不是從零開始做機器人,而是將其已有的感知能力向新的終端形態延伸。

這種能力複用的商業模式,在科技行業有成熟先例。特斯拉從電動汽車延伸到人形機器人,核心複用是其自動駕駛的視覺感知與決策系統;大疆從無人機延伸到手持影像設備,核心複用是其雲臺穩定與視覺算法。vivo的邏輯類似:將手機影像領域積累的視覺感知能力,移植到機器人場景。這既降低了技術研發的邊際成本,也縮短了新業務的商業化驗證週期。

但在具體路徑上,vivo選擇了一條看起來更穩健務實的路線。

“我們的資源還是要聚焦在用戶場景下最關鍵的技術點上做重要突破。”胡柏山說。

vivo機器人Lab首席科學家邵浩認爲,真正的智能不僅僅是“疊衣服”這一個動作,而是從用戶進門脫下外套開始,涵蓋洗衣、烘乾、收納等上千個子流程的完整閉環。“我們需要找到用戶到底需要機器人解決什麼問題,而且解決的一定是端到端的問題。”邵浩說。

邵浩算過一筆時間賬:家用機器人不需要一步到位達到完全自主的 L4 級別。“一開始,可能95%的操作得靠人機協同或者專業人員遙控。隨着數據飛輪轉起來,人需要插手的比例會慢慢降到60%、30%,最終在十年後降到0%。”

胡柏山將這種策略稱爲“沿途下蛋”,機器人的思路並不是一步到位實現完全自動化,而是從具體場景逐步推進,通過真實使用數據不斷提升能力,再擴展到更多應用場景。

這種“漸進式”策略,折射出vivo對技術商業化節奏的清醒判斷。機器人賽道技術成熟度遠未達到消費級普及的臨界點,過早追求“全自主”不僅成本高昂,而且容易陷入技術炫技與商業落地的脫節。從“人機協同”起步,通過真實場景數據迭代能力,本質上是將手機領域的“數據即壁壘”邏輯複製到機器人賽道——先跑通數據閉環,再逐步降低人工干預比例。

未來,vivo還有望在“手機-MR-機器人”之間也建立正循環。手機和MR技術爲機器人提供技術積累,而機器人的應用又反過來擴展技術邊界,反哺手機和MR產品。

也就是說,vivo的機器人佈局,其戰略意義不在於短期內貢獻多少營收,而在於爲“後手機時代”儲備入場券。當智能手機市場觸達天花板,下一個億萬級終端形態是什麼,沒有人能給出確定答案。vivo的選擇是:用手機養AI,用AI養機器人,用機器人反哺生態。這套邏輯能否跑通,取決於三個前提:手機主業能否持續輸血,AI能力能否持續領先,機器人商業化節奏能否匹配預期。

從Agent Phone到IoT與機器人的延展,vivo正在打破傳統手機廠商的邊界。在硬件利潤日漸攤薄的今天,這不僅是一次技術的升級,更是戰略定力與資源調配能力的考驗,是一場關於“下一個十年終端形態”的戰略押注。

Scroll to Top