Pokemon Go玩家拍了十年街景,現在AI用它來給機器人送外賣

由 DeepTech深科技 發佈於 科技

'26-03-11

(來源:麻省理工科技評論)


《Pokémon Go》是全球首個爆款增強現實遊戲。2016 年,Google 孵化公司 Niantic 推出了這款將 AR 技術融入《神奇寶貝》這一超級 IP 的作品,迅速席捲全球。從芝加哥到奧斯陸,再到江之島,玩家們紛紛走上街頭,滿懷期待地尋覓胖丁、傑尼龜,或是(極其幸運地)捕捉那隻懸浮在現實世界中、觸手可及卻又遙不可及的超稀有洗翠雷鳥。


這使得數以億計的人將手機鏡頭對準了無數棟建築。“這款應用在 60 天內被 5 億人安裝,”Niantic 於去年 5 月分拆成立的 AI 公司 Niantic Spatial 的首席技術官布萊恩·麥克倫頓(Brian McClendon)說。據從 Niantic 手中收購《Pokémon Go》的遊戲公司 Scopely 披露,2024年,這款遊戲在發佈整整八年後,月活躍玩家仍超過 1 億。


如今,Niantic Spatial 正在利用這批規模龐大、無可比擬的衆包數據來構建一種“世界模型”——畢竟,來自全球數億《Pokémon Go》玩家手機拍攝的城市地標圖像,並附有超高精度的位置標註。這是一種新興技術,旨在將大語言模型的智能能力與真實物理環境相結合。


該公司最新推出的產品是一個模型,聲稱僅憑數張周邊建築或地標的快照,便能將用戶在地圖上的位置精確定位至釐米級。公司希望將其用於在 GPS 信號不穩定的場景中,幫助機器人實現更精準的導航。


作爲技術的首次大規模實測,Niantic Spatial 已與 Coco Robotics 達成合作。Coco Robotics 是一家在美國和歐洲多個城市部署“最後一公里”配送機器人的初創公司。“所有人都以爲 AR 是未來,都覺得 AR 眼鏡即將到來,”麥克倫頓說,“然後機器人成了那個目標用戶。”


從皮卡丘到披薩配送


Coco Robotics 在洛杉磯、芝加哥、澤西城、邁阿密和赫爾辛基部署了約 1000 臺航空箱大小的機器人,每臺可搭載最多 8 個特大號披薩或 4 袋購物袋。據首席執行官扎克·拉什(Zach Rash)介紹,這些機器人迄今已完成逾 50 萬次配送,在各種天氣條件下累計行駛數百萬英里。


然而,要與人類快遞員競爭,這些在人行道上以約每小時 8 公里的速度行進的機器人,必須達到極高的可靠性。“我們最好的服務,就是在承諾的時間準時到達。”拉什說,這意味着不能迷路。


Coco 面臨的問題在於,無法依賴 GPS。在城市中,無線電信號在建築物之間相互反射干擾,導致 GPS 信號往往很弱。“我們在很多高樓林立、有高架橋和立交橋的密集區域送餐,而這些地方恰恰是 GPS 從來都不好用的地方,”拉什說。


“城市峽谷是全球 GPS 最糟糕的場景,”麥克倫頓說,“打開手機看那個藍色定位點,你會發現它常常漂移 50 米,把你定位到另一條街、另一個方向、馬路的另一側。”這正是 Niantic Spatial 切入的地方。


過去數年,Niantic Spatial 持續整合《Pokémon Go》和 Ingress(Niantic 於 2013 年推出的上一款手機 AR 遊戲)玩家貢獻的數據,構建了一套視覺定位系統——一種根據視野所見來判斷位置的技術。“讓皮卡丘真實地在現實世界中奔跑,和讓 Coco 機器人安全、精準地穿行於城市,本質上是同一個問題。”Niantic Spatial 首席執行官約翰·漢克(John Hanke)說。


“視覺定位並不是什麼全新的技術,”地圖與地理空間分析軟件公司 ESRI 的康拉德·文澤爾(Konrad Wenzel)說,“但顯然,外部攝像頭越多,效果就越好。”


Niantic Spatial 用 300 億張城市環境圖像訓練了其模型,這些圖像高度集中於熱點地點——也就是 Niantic 遊戲中鼓勵玩家到訪的重要場所,例如寶可夢對戰場館。“我們在全球擁有逾百萬個可對用戶進行精確定位的地點,”麥克倫頓說,“我們知道你站在哪裏,精度在幾釐米以內,更重要的是,我們知道你在看向哪個方向。”


由此帶來的結果是,對於這百萬個地點中的每一處,Niantic Spatial 都積累了數以千計的圖像,這些圖像拍攝地點大致相同,但角度不同、時段不同、天氣不同。每張圖像都附有詳盡的元數據,精確記錄了拍攝瞬間手機在空間中的位置,包括朝向、角度、是否在移動,以及移動速度和方向等信息。


該公司以此數據集訓練了一個模型,讓其通過分析所見內容來精確判斷自身所處位置。即便是在那百萬熱點之外、圖像和位置數據相對稀缺的地點,同樣適用。


除 GPS 之外,裝配了四個攝像頭的 Coco 機器人,現在還將藉助這一模型判斷自身位置和前進方向。機器人攝像頭位於腰部高度,可同時覆蓋四個方向,與《Pokémon Go》玩家的視角略有不同,但拉什表示,數據的適配改造十分順暢。


競爭對手同樣在使用視覺定位系統。例如,2014 年在愛沙尼亞創立的機器人配送公司 Starship Technologies 表示,其機器人會利用傳感器構建周圍環境的三維地圖,標繪建築邊緣和路燈位置。


但拉什押注 Niantic Spatial 的技術將爲 Coco 帶來競爭優勢。他聲稱,這將使機器人能夠精準停在餐廳門外的指定取餐位,既不妨礙他人,又能停在顧客門前——而不是像過去有時那樣停在稍遠的地方。


機器人領域的寒武紀?


漢克表示,Niantic Spatial 最初開發視覺定位系統,是爲了將其應用於增強現實。“如果你戴着 AR 眼鏡,希望虛擬世界與你所看的方向精確對齊,就需要某種方法來實現這一點,”他說,“但現在,我們正在見證機器人領域的寒武紀大爆發。”


這些機器人中,部分將需要與人類共享空間,例如建築工地和人行道。“如果機器人要以不打擾人類的方式融入這些環境,就必須具備與人類相近的空間理解能力,”漢克說,“我們能幫助機器人在被碰撞或推移之後,精確定位自身所在。”


與 Coco Robotics 的合作只是開始。漢克表示,Niantic Spatial 正在搭建的,是他所稱的“活地圖”的第一批基礎模塊:一幅隨世界變化而實時更新的超精細虛擬世界模擬。隨着 Coco 及其他公司的機器人在現實世界中持續移動,它們將不斷提供新的地圖數據,推動數字世界複製品的精度持續提升。


在漢克和麥克倫頓看來,地圖不僅變得越來越精細,也越來越多地被機器使用,這從根本上改變了地圖的意義。長久以來,地圖的作用是幫助人類在世界中定位自身。從二維到三維,再到四維(如數字孿生體等實時模擬),這一基本邏輯從未改變:地圖上的點對應空間或時間中的點。


然而,面向機器的地圖或許需要更像一本指南,充滿人類習以爲常但機器需要明確告知的信息。Niantic Spatial 和 ESRI 等公司希望爲地圖添加描述性標註,讓機器理解它們究竟在看什麼——爲每個對象打上涵蓋其屬性的標籤。“這個時代的核心任務,是爲機器構建有用的世界描述,”漢克說,“我們所擁有的數據,是建立世界運作脈絡理解的絕佳起點。”


當前,世界模型正處於熱議之中,Niantic Spatial 對此心知肚明。大語言模型或許看似無所不知,但在解讀和與日常環境交互方面,它們的常識極爲匱乏。世界模型旨在彌補這一缺陷。Google DeepMind 和 World Labs 等公司正在開發能夠即時生成虛擬幻想世界的模型,並將其作爲訓練 AI 智能體的演練場。


Niantic Spatial 表示,自己從另一個角度切入這一問題。麥克倫頓認爲,地圖製作推進到極致,最終會捕捉到一切:“我非常專注於重現真實世界。我們還沒到那一步,但那是我們的目標。”


原文鏈接:

https://www.technologyreview.com/2026/03/10/1134099/how-pokemon-go-is-helping-robots-deliver-pizza-on-time/

Scroll to Top