腦袋綁iPhone錄視頻,時薪15美元,數千零工撐起機器人訓練大業

由 DeepTech深科技 發佈於 科技

'26-04-03

(來源:麻省理工科技評論)


宙斯(Zeus)是一名醫學生,住在尼日利亞中部一座山城。每天從醫院結束漫長的一天回到他的單間公寓後,他會打開環形補光燈,把 iPhone 綁在額頭上,開始錄像。他像夢遊一樣把雙手舉在身前,然後給牀鋪上牀單。他動作緩慢而小心,確保雙手始終留在鏡頭畫面內。


宙斯是 Micro1 的一名數據錄製員。Micro1 是一家總部位於加州帕洛阿爾託的美國公司,專門收集真實世界數據並出售給機器人公司。隨着特斯拉、Figure AI 和 Agility Robotics 等公司競相打造能在工廠和家務環境中像人一樣工作的人形機器人,像宙斯這樣的零工錄製的視頻正在成爲訓練機器人最熱門的新方式。


Micro1 在全球 50 多個國家僱用了數千名合同工,包括印度、尼日利亞和阿根廷,這些地方有大量精通技術的年輕人在找工作。他們把 iPhone 固定在頭上,錄下自己疊衣服、洗碗和做飯的過程。這份工作按當地標準收入不錯,也在提振當地經濟,但它引發了關於隱私和知情同意的棘手問題;而且這份工作有時候很有挑戰性,有時候也很怪。


宙斯是去年 11 月找到這份工作的,當時 LinkedIn 和 YouTube 上到處都在討論它。“這會是一個很好的機會,留下自己的印記,提供將來用於訓練機器人的數據,”他想。


宙斯的時薪是 15 美元,在失業率高企、經濟緊張的尼日利亞,這是一份不錯的收入。但作爲一個滿懷憧憬、夢想成爲醫生的學生,他覺得每天花好幾個小時熨衣服實在無聊。


“我真的不太喜歡這份工作,”他說,“我是那種需要……一份技術性工作、需要動腦子的人。”


宙斯以及所有接受《麻省理工科技評論》採訪的工人都要求僅使用化名,因爲他們未被授權談論自己的工作。


人形機器人出了名地難造,因爲操控物理物體是一項極難掌握的技能。但 ChatGPT 等聊天機器人背後的大語言模型的崛起,給機器人領域帶來了一次範式轉換。正如大語言模型通過在互聯網上抓取的海量文本上訓練來學會生成文字,許多研究者相信,人形機器人也可以通過在大量運動數據上訓練來學會與世界互動。


不過,機器人領域需要的是關於物理世界的、複雜得多的數據,而這類數據要難找得多。虛擬仿真可以訓練機器人做特技動作,但教不會它們如何抓取和移動物體,因爲仿真難以完美精確地模擬物理規律。要讓機器人在工廠裏工作、在家裏當管家,真實世界的數據可能纔是我們需要的——儘管採集起來既耗時又昂貴。


投資者正在瘋狂砸錢解決這個問題,2025 年在人形機器人領域的投資超過 60 億美元。在家錄製數據正在成爲全球蓬勃發展的零工經濟。Scale AI 和 Encord 等數據公司正在招募自己的數據錄製大軍,DoorDash 付錢讓外賣騎手拍攝自己做家務的視頻。在一些國家,數十個國有機器人訓練中心的工人佩戴 VR 頭盔和外骨骼,教人形機器人如何打開微波爐和擦桌子。


“需求非常大,而且增長非常快,”Micro1 的 CEO 阿里·安薩里(Ali Ansari)說。他估計,機器人公司現在每年花費超過 1 億美元向他的公司和類似公司購買真實世界數據。


一天的生活


Micro1 的工人由一個名爲 Zara 的 AI 智能體進行篩選,Zara 會面試候選人並審查他們提交的家務視頻樣本。每週,工人們提交自己在家做家務的視頻,按照一系列指示操作,比如保持雙手可見、以自然速度移動。視頻經 AI 和人工雙重審覈後,要麼被接受,要麼被駁回。之後由 AI 和一個數百人的團隊對視頻中的動作進行標註。


由於這種訓練機器人的方法還處於起步階段,什麼樣的數據算好的訓練數據目前並不清楚。但安薩里表示,“你需要提供大量的變體,機器人才能在基本的導航和物體操控方面實現良好的泛化。”


但很多工人說,在他們狹小的住所裏創造各種“家務內容”是一個挑戰。宙斯是一個精打細算的學生,住在簡樸的單間裏,每天除了熨衣服幾乎錄不出別的內容。阿爾俊(Arjun)是印度德里的一名家教,錄一段 15 分鐘的視頻要花一個小時,因爲他需要大量時間來構思新的家務內容。


“家裏就這麼大,能拍出多少花樣來?”阿爾俊抱怨道。


還有一個棘手的隱私問題。Micro1 要求工人不要在鏡頭前露臉,也不要暴露姓名、電話號碼和出生日期等個人信息。然後公司使用 AI 和人工審覈員來刪除漏網的內容。


但即使沒有面部信息,這些視頻也捕捉到了工人們生活中非常私密的一面:他們家的內部陳設、私人物品和日常作息。而且工人們在忙着對着鏡頭做家務的時候,很難意識到自己可能正在錄下什麼樣的個人信息。對這類視頻的審覈可能無法過濾掉除最明顯標識符之外的敏感信息。


對有家庭的工人來說,讓私生活不入鏡是一場持續的拉鋸戰。阿爾俊有兩個女兒,他得想方設法把鬧騰的兩歲小女兒擋在畫面外。“有時候很難工作,因爲我女兒太小了,”他說。


薩莎(Sasha)原來在尼日利亞做銀行職員,現在轉行當數據錄製員。她住在一個共用的居民大院裏,在外面晾衣服時得躡手躡腳,生怕錄到鄰居。鄰居們看着她,滿臉困惑。


雖然接受《麻省理工科技評論》採訪的工人們都知道自己的數據被用於訓練機器人,但沒有人知道自己的數據具體會被如何使用、存儲以及與第三方共享,包括 Micro1 將數據出售給的那些機器人公司。安薩里說,出於保密原因,Micro1 不會向工人透露客戶名稱或他們參與項目的具體性質。


“如果工人們參與了這項工作,公司有責任告知他們這些數據的用途……這類技術可能走向何方,以及長遠來看可能對他們產生什麼影響,”馬里蘭大學人本計算教授亞斯敏·科圖裏(Yasmine Kotturi)說。


一些工人表示,他們偶爾會看到其他工人在公司的 Slack 頻道里詢問公司能否刪除自己的數據。Micro1 拒絕就此類數據是否會被刪除發表評論。


“人們是自願選擇做這份工作的,”安薩里說,“他們隨時可以停止。”


對數據如飢似渴


由於數千名工人在不同的家裏以不同的方式做家務,一些機器人學家質疑這些數據是否可靠到足以安全地訓練機器人。


“我們在家裏的生活方式,從安全角度來說並不總是正確的,”ASTM International 的機器人學家亞倫·普拉瑟(Aaron Prather)說,“如果這些人把可能導致事故的壞習慣教給了機器人,那就不是好數據。”而且收集的數據量之大也讓質量審覈充滿挑戰。但安薩里表示,公司會駁回展示不安全操作方式的視頻,而笨拙的動作反而可以用來教機器人什麼是不該做的。


還有一個問題是我們到底需要多少數據。Micro1 表示自己擁有數萬小時的素材,Scale AI 則宣佈收集了超過 10 萬小時。


“要達到目標還需要很長時間,”加州大學伯克利分校的機器人學家肯·戈德伯格(Ken Goldberg)說。大語言模型訓練用的文本和圖像,一個人要讀 10 萬年才能讀完,而人形機器人可能需要更多數據,因爲控制機器人關節比生成文字還要複雜。“這件事花的時間會比人們以爲的要長,”他說。


達圖(Dattu)是一名工程系學生,住在印度一座繁忙的科技城市。每天從大學上完一整天課回到家後,他跳過晚飯,直奔他那個堆滿盆栽和啞鈴的狹小陽臺。他把 iPhone 綁在額頭上,一遍又一遍地錄下自己疊同一堆衣服的過程。


家人困惑地看着他。“對他們來說這就像什麼太空科技,”他說。當他告訴朋友自己的工作時,“他們聽到錄家務視頻還能拿錢,都驚呆了。”


在大學課業、數據錄製和其他數據標註零工之間來回奔波讓他很疲憊。但他還是覺得,“這感覺像是在做一件全世界都還沒做過的事。”


原文鏈接:

https://www.technologyreview.com/2026/04/01/1134863/humanoid-data-training-gig-economy-2026-breakthrough-technology/

Scroll to Top