行業觀察｜中國手機大廠都在做AI，vivo解法有何不同-財經-今日熱點-聚焦看點

胡柏山提出，手機正從Smart Phone走向Agent Phone，這一進化有望激活存量市場，帶來新的增長空間

文｜黃思韻

編輯｜謝麗容

供應鏈成本持續上行、存儲等核心器件價格大幅攀升，疊加換機週期延長，手機廠商正面臨近年來最嚴峻的成本壓力。

除了被迫調價，手機行業還能如何破局？

3月25日，vivo總裁、首席運營官、vivo中央研究院院長鬍柏山在博鰲亞洲論壇期間提出，手機正從Smart Phone走向Agent Phone，這一進化有望有望激活存量市場，帶來新的增長空間。

在vivo看來，未來的手機將不再是被動等待指令的工具，而是一個能看見、能思考、能行動的“數字夥伴”。

這一次，vivo押注的是影像+AI雙核驅動的價值重構。

vivo的路徑是立足端側AI，通過軟硬件深度結合構建差異化，同時以影像能力作爲感知物理世界的核心入口，並將技術邊界延伸至家庭機器人與IoT生態。在成本壓力倒逼全行業的當下，vivo依賴的不是短期提價，而是用AI驅動的價值增量。

今年年初，vivo將“感知賽道”設立爲內部重要的一級支撐技術賽道，致力於將視覺、聽覺、觸覺等，通過傳感器結合大模型，轉化爲機器能理解的物理世界信息。胡柏山評價，企業選擇建立怎樣的感知系統，決定了它要解決用戶什麼場景的問題，進而決定了它能沉澱下怎樣的物理世界數據。

“未來最大的差異化在於場景數據，不在於模型。”胡柏山給出了一個明確結論。

成本和存量競爭壓力倒逼手機行業重新思考增長邏輯，幾乎所有核心廠商都把答案指向AI。胡柏山稱：未來十年，智能手機依然會是人機交互的絕對主導載體。手機將不僅是通訊工具，更是AI落地的“第一現場”，成爲物理世界的感知樞紐與個人數字大腦。

vivo的獨特之處在於兩點。

其一，從戰略取捨視角，它是“差異化從何而來”的底層判斷。基於“未來最大的差異化在於數據，不在於模型”的戰略判斷，vivo選擇不在模型參數上盲目競賽，而將資源押注在“感知賽道”——用影像能力構建物理世界的理解系統，用端側模型沉澱用戶場景數據。這不僅是技術的選擇，更是戰略的取捨。

其二，從戰略縱深視角，vivo的野心不止於手機。從端側模型的小型化，到“感知賽道”的佈局，再到機器人Lab的成立，vivo正在構建一條從Agent Phone到機器人生態的技術縱貫線。誰能在感知層面沉澱下更深的護城河，誰才能在AI時代的終端競爭中真正勝出。

vivo總裁、首席運營官、vivo中央研究院院長鬍柏山來源：vivo

數據即壁壘，押注端側的邏輯

端側AI的核心價值在於：本地計算帶來低延遲、高隱私、弱依賴，但其真正的護城河，是場景數據。當各家都能調用同樣的大模型時，誰能在端側沉澱更深、更細、更貼合用戶場景的數據，誰才能真正構建差異化。

這正是vivo作爲全球TOP4出貨量終端廠商所擅長的。

生成式AI正加速向終端側滲透。互聯網巨頭、硬件廠商、車企、初創公司，各路玩家殊途同歸——把大模型裝進更貼身的設備，搶佔下一代移動生態的入口。

手機是這場入口爭奪戰的核心載體。胡柏山判斷，手機行業擁有全球數十億級的用戶入口，是用戶7×24小時AI體驗的全天候載體，也是爲數不多能夠統籌芯片、算法、系統、應用、服務這五個環節的產業角色。

但入口在手，不等於壁壘自成。vivo AI副總裁張飛提到當下行業痛點：手機各大數據分散在各種App裏面，用戶在做跨場景任務時成本極高。數據是AI的燃料，卻被鎖在應用孤島裏，難以被調用、整合、轉化爲智能。

這是vivo選擇“把模型做進端側”的底層邏輯——不是在雲端替用戶處理數據，而是在本地構建一個能理解、能整合、能行動的數字中樞。

第三方數據機構弗若斯特沙利文預測，全球端側AI市場規模將從2025年約3219億元增長至2029年1.2萬億元，年複合增長率達39.6%。這意味着，市場夠大，賽道夠長，不過參與者衆多——AI手機、可穿戴設備、智能家居、人形機器人，每一片海域都擠滿了入局者。

近兩三年，國產主流手機廠商都在瞄準AI手機這一入口，各自打造系統級智能體，試圖搶奪高端手機市場份額。路徑大致分兩類：一是自研垂類大模型，如vivo爲其系統助手“藍心小V”引入了藍心大模型；另一種是接入外部大模型，如2025年年初多家手機接入DeepSeek。

問題在於，當各家都能接入大模型的能力時，純軟件層面的AI優化很難形成真正的壁壘。大模型是“智商”，可通過合作或自研獲得；場景數據是“閱歷”，則需要自己長期積累。胡柏山在羣訪中點明要害：軟硬件深度結合，才能打造真正的差異化。他進一步判斷，相較於模型，基於用戶場景的AI能力積累纔是最有差異化的核心競爭力。“這個方面我們肯定是要幹，不做肯定不行。”

vivo的破局點由此清晰：立足端側，用軟硬構建場景數據護城河，形成差異化。

在模型層，2025年vivo開發者大會，vivo副總裁周圍曾宣佈，vivo構建了全球首個專爲端側Agent（智能體）構建的3B（30億規模）模型，該端側模型在語言外還具備多模態、推理、長文本、面向UI Agent等五大能力優勢。

小型化，是爲了在端側跑得更快、更省、更穩。

在硬件層，針對傳統SoC芯片在處理端側模型時帶寬不足、散熱受限等物理瓶頸時，vivo已經在兩年前就開始佈局定製專用的算力芯片，再匹配上端側算法，這有助於支撐相機、會議、出行、遊戲等端側Agent場景的爆發。

芯片自研，是爲了不讓算力成爲場景數據沉澱的瓶頸。

從模型到芯片，vivo的端側佈局環環相扣。表面看是技術競賽，底層邏輯卻是場景數據戰爭——誰能在端側沉澱更深、更細、更貼合用戶場景的數據，誰就能在AI時代的終端競爭中構建真正的護城河。

vivo連續五年亮相博鰲亞洲論壇來源：vivo

影像爲“眼”，做實差異化錨點

如何讓消費者在手機漲價週期仍然願意買單，這是擺在各大手機廠商面前的難題。vivo的答案，是其最大的長板——影像。

影像能力是vivo過去十年在手機市場立足的根基之一。從自研影像芯片到蔡司光學共研，vivo構建了一套覆蓋光學設計、硬件製造、算法調校的完整技術體系。這套體系在消費者端逐步形成了如今其X數字系列旗艦產品“專業V單”的心智認知——影像領先是其高端化進程中少有的可量化品牌資產。

現在，影像的戰略價值正在被重新評估——它不再只是拍攝工具，而是Agent Phone感知物理世界的“眼睛”。在vivo的影像+AI戰略規劃中，AI大模型是“大腦”，影像能力是“眼睛”。胡柏山點明：AI下半場的決勝點，不在於模型參數，而在於對物理世界的感知與理解。影像能力與Agent體驗的疊加，將構成產品除外觀設計之外最大的差異化因素。

這意味着，vivo過去十年積累的影像能力，正在從“功能賣點”升級爲“戰略資產”。

即將發佈的vivo X300 Ultra和X300s，是這一邏輯的一次商業化試水。其影像Agent，能夠根據環境理解自動推薦構圖與功能——從“看懂畫面”到“作出判斷”，本質上是從感知能力向決策能力的躍遷。同樣的邏輯正在向X Fold系列（辦公與出行）和iQOO系列（遊戲）複製。

不同產品線的差異化Agent佈局，折射出vivo試圖將感知能力適配到高頻場景的清晰思路。

從商業邏輯看，這一路徑有其合理性。一方面，vivo在影像領域的長期投入形成了技術壁壘，這是多數競爭對手短期內難以複製的。另一方面，胡柏山反覆強調的“未來最大的差異化在於場景數據，不在於模型”，影像Agent的價值，恰恰在於它能在用戶最自然的操作鏈路中完成場景數據採集——什麼時間、什麼地點、什麼構圖、什麼場景，這些數據是模型訓練無法替代的“燃料”。

從戰略意圖看，vivo正在嘗試一條從硬件廠商向“感知數據平臺”演進的路徑。用影像構建物理世界的感知入口，用端側模型沉澱場景數據，用Agent能力放大體驗價值——這套邏輯如果跑通，將支撐其高端化戰略，並在AI時代的終端競爭中佔據有利身位。

在元器件價格上漲和市場增長趨緩的背景下，手機廠商已經很難再依靠出貨量擴大規模，利潤空間被不斷壓縮。多位手機廠商相關人士表示，在當前供應價格壓力下，行業普遍只能“向上卷”，通過高端機型提升溢價空間。

但戰略邏輯的成立，並不等於商業落地的必然。vivo接下來要繼續解決三個挑戰。

其一，消費者是否願意爲“Agent能力”買單，尚待市場驗證。影像功能是顯性價值，用戶能直觀感知“拍得更好”；Agent能力是隱性價值，其體驗提升需要時間沉澱。如何在漲價週期中讓消費者爲“看不見的智能”支付溢價，是包括vivo在內的所有廠商都要回答的問題。

其二，從感知到決策的能力躍遷，技術成熟度仍是變量。影像Agent的核心在於“理解”而非“識別”，這需要模型在端側具備足夠的推理能力，同時保持低功耗、低延遲。vivo已佈局定製算力芯片和3B端側模型，接下來要保障大規模商用後的穩定輸出能力。

其三，競品並未缺席。其他手機廠商同樣在推進AI與影像的融合，且各有技術積累。vivo雖然影像領先，但對手在算法、生態、渠道等方面也不甘示弱。當所有廠商都在講“影像+AI”的故事時，vivo能否真正形成差異化認知，取決於其技術落地速度與用戶痛點場景體驗提升。

沿途下蛋，能力複用的長線命題

Agent Phone之外，vivo正在把技術邊界穩步拓展至多場景智能生態，向生態型科技平臺企業邁進。這其實是其技術體系的自然延展。

vivo在2025年成立機器人Lab，重點佈局機器人的“大腦”和“眼睛”，並將家庭場景作爲長期方向。胡柏山在博鰲論壇羣訪中解釋：手機連接數字世界，機器人連接物理世界，兩者最終可能形成統一的技術體系。

這一判斷背後，是vivo對未來技術結構的理解：AI與機器人分別代表數字世界與物理世界最核心的技術方向，而手機憑藉最廣泛的用戶基礎和數據入口，可能成爲連接兩者的中樞。

從商業邏輯看，vivo的機器人佈局有其內在必然性。

圍繞這一目標，vivo正在加強影像與感知能力的佈局，通過視覺系統構建對物理世界的理解能力，並逐步向IoT設備和機器人延伸。這套能力在手機上的應用場景是拍照與影像，但其底層邏輯——對光線、空間、動作、場景的理解與判斷——同樣適用於機器人。也就是說，vivo不是從零開始做機器人，而是將其已有的感知能力向新的終端形態延伸。

這種能力複用的商業模式，在科技行業有成熟先例。特斯拉從電動汽車延伸到人形機器人，核心複用是其自動駕駛的視覺感知與決策系統；大疆從無人機延伸到手持影像設備，核心複用是其雲臺穩定與視覺算法。vivo的邏輯類似：將手機影像領域積累的視覺感知能力，移植到機器人場景。這既降低了技術研發的邊際成本，也縮短了新業務的商業化驗證週期。

但在具體路徑上，vivo選擇了一條看起來更穩健務實的路線。

“我們的資源還是要聚焦在用戶場景下最關鍵的技術點上做重要突破。”胡柏山說。

vivo機器人Lab首席科學家邵浩認爲，真正的智能不僅僅是“疊衣服”這一個動作，而是從用戶進門脫下外套開始，涵蓋洗衣、烘乾、收納等上千個子流程的完整閉環。“我們需要找到用戶到底需要機器人解決什麼問題，而且解決的一定是端到端的問題。”邵浩說。

邵浩算過一筆時間賬：家用機器人不需要一步到位達到完全自主的 L4 級別。“一開始，可能95%的操作得靠人機協同或者專業人員遙控。隨着數據飛輪轉起來，人需要插手的比例會慢慢降到60%、30%，最終在十年後降到0%。”

胡柏山將這種策略稱爲“沿途下蛋”，機器人的思路並不是一步到位實現完全自動化，而是從具體場景逐步推進，通過真實使用數據不斷提升能力，再擴展到更多應用場景。

這種“漸進式”策略，折射出vivo對技術商業化節奏的清醒判斷。機器人賽道技術成熟度遠未達到消費級普及的臨界點，過早追求“全自主”不僅成本高昂，而且容易陷入技術炫技與商業落地的脫節。從“人機協同”起步，通過真實場景數據迭代能力，本質上是將手機領域的“數據即壁壘”邏輯複製到機器人賽道——先跑通數據閉環，再逐步降低人工干預比例。

未來，vivo還有望在“手機-MR-機器人”之間也建立正循環。手機和MR技術爲機器人提供技術積累，而機器人的應用又反過來擴展技術邊界，反哺手機和MR產品。

也就是說，vivo的機器人佈局，其戰略意義不在於短期內貢獻多少營收，而在於爲“後手機時代”儲備入場券。當智能手機市場觸達天花板，下一個億萬級終端形態是什麼，沒有人能給出確定答案。vivo的選擇是：用手機養AI，用AI養機器人，用機器人反哺生態。這套邏輯能否跑通，取決於三個前提：手機主業能否持續輸血，AI能力能否持續領先，機器人商業化節奏能否匹配預期。

從Agent Phone到IoT與機器人的延展，vivo正在打破傳統手機廠商的邊界。在硬件利潤日漸攤薄的今天，這不僅是一次技術的升級，更是戰略定力與資源調配能力的考驗，是一場關於“下一個十年終端形態”的戰略押注。

行業觀察｜中國手機大廠都在做AI，vivo解法有何不同

入境遊火熱上海郵輪口岸迎來今年首次“三船同靠”

2026中關村論壇年會落幕多項重大科技成果集中發佈

春節後肉類消費進入淡季疊加供給較高，生豬價格跌至近年低位

評級機構穆迪下調今年意大利經濟增長預期

相關推薦