免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

具身數(shù)據(jù)戰(zhàn)開打!普通人都能上手,邊采邊篩,只喂機器人愛吃的

0
分享至

衡宇 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

現(xiàn)在,一部手機,加一個“夾爪”,就能隨時隨地完成具身智能數(shù)據(jù)采集了!



采出來的數(shù)據(jù)不臟也不廢,已經(jīng)在實際模型訓(xùn)練中跑出了效果

模型在多步連續(xù)任務(wù)中動作銜接更穩(wěn)定;

在真實場景中面對光照變化、環(huán)境雜亂、物體遮擋時也更不容易失手,執(zhí)行魯棒性顯著提升;

而當(dāng)任務(wù)發(fā)生小幅變化,比如同類但不同順序的操作目標(biāo)出現(xiàn)時,模型也更容易舉一反三,做出合理應(yīng)對。

這套采集系統(tǒng),模型效果是純純地全肯定。



這套可搭載手機的數(shù)采終端及其配套應(yīng)用程序,名叫RoboPocket,來自具身智能創(chuàng)企穹徹智能。

它是新興采集設(shè)備UMI(Universal Manipulation Interface)的進階狀態(tài)。

和傳統(tǒng)UMI方案相比,RoboPocket保持便攜易用的基礎(chǔ)上,更加輕盈:手機+夾爪即是一個節(jié)點。

如此一來,每個人——哪怕是普通人,都可以從口袋里掏出RoboPocket,隨時隨地采集具身數(shù)據(jù)。

但這還算不上它最出彩的地方。

最妙的是,RoboPocket把模型需求前置到采集一線,讓你隨時接入模型的訓(xùn)練閉環(huán)。

采集行為發(fā)生時,系統(tǒng)會同步判斷每一段數(shù)據(jù)的訓(xùn)練價值,并即時給出反饋與引導(dǎo),盡量讓采集行為本身就朝著模型真正需要的方向收斂。

每一次采集都直接服務(wù)于模型進化,浪費不了一點。



在數(shù)據(jù)還在生成的過程中,就對其完成了價值篩選。

最終采來交付給模型的數(shù)據(jù)從采集源頭就來得更加清晰,更加準(zhǔn)確,對模型也更有用。

具身模型想scale up,卡在數(shù)據(jù)哪一步?

在具身智能領(lǐng)域,數(shù)據(jù)的重要性幾乎是共識性的。

具身模型們嗷嗷待哺,等待大量高質(zhì)量、多樣性的具身數(shù)據(jù)的投喂。

從2023年起,許多團隊投入大量資源建設(shè)數(shù)采廠,希望通過規(guī)模化生產(chǎn)來支撐模型訓(xùn)練。

實踐很快暴露出一個現(xiàn)實問題,數(shù)采流水線建起來了,數(shù)據(jù)量上來了,模型能力卻并沒有穩(wěn)定持續(xù)地提升。

原因并不神秘。

數(shù)采廠依賴的是預(yù)設(shè)場景和標(biāo)準(zhǔn)化流程,這種方式在工業(yè)數(shù)據(jù)中行之有效,但在具身智能里,很難覆蓋真實世界中大量非標(biāo)準(zhǔn)、非重復(fù)的操作情境。

動作容易趨于模式化,任務(wù)分布集中,環(huán)境變化有限,數(shù)據(jù)之間高度相似,訓(xùn)練收益很快出現(xiàn)邊際遞減。

有相關(guān)從業(yè)人員告訴我們,現(xiàn)在的具身數(shù)據(jù)一天比一天多了,結(jié)果訓(xùn)練效率出現(xiàn)不升反降情況



而具身模型真正需要的,恰恰是那些發(fā)生在真實環(huán)境中的、不那么規(guī)整的操作過程。

這也是UMI出現(xiàn)的背景。

UMI輕量便攜,更易使用,一方面減少了數(shù)采成本,更重要的是開始讓具身數(shù)據(jù)采集擺脫了固定場地的限制。

任何人,可以在室內(nèi)和戶外的任何真實世界場景里自然完成操作。

如此一來,采集的數(shù)據(jù)也是貼近現(xiàn)實分布的。這就彌補了數(shù)采廠和真實世界存在gap的問題。

但當(dāng)UMI開始被業(yè)界認(rèn)可和逐漸大規(guī)模使用后,新的問題也隨之顯現(xiàn)。

在真實場景中,采集更自由了,但質(zhì)量控制隨之變難了。

動作是否有效?軌跡是否合理?采集節(jié)奏是否適合訓(xùn)練?這些問題往往只有數(shù)據(jù)回傳清洗,開始拿來訓(xùn)模型的后處理階段才能發(fā)現(xiàn)。

大量低價值數(shù)據(jù)被一路送進管線,清洗與返工成本迅速抬升,訓(xùn)練周期被不斷拉長。

所以關(guān)于UMI的“不可能三角”被抬到了臺前——

采集質(zhì)量、使用便捷性與后處理壓力三者難以同時優(yōu)化。

如果追求采集質(zhì)量,就往往要犧牲便攜性;如果降低門檻提高便攜性,比如像傳統(tǒng)UMI僅靠腕部模組或“人-夾爪”采集,就又很難保證數(shù)據(jù)的可用性;如果希望用后處理階段兜底,就意味著要承受高昂的清洗、篩選與修復(fù)成本,訓(xùn)練閉環(huán)被迫拉長。

現(xiàn)有的UMI方案并沒有解決“采得的數(shù)據(jù)能不能用”這個問題——這一點恰恰對模型訓(xùn)練至關(guān)重要。

于是,穹徹團隊決定回到問題的原點,重新出發(fā)。

他們從第一性原理出發(fā),提出一個關(guān)鍵設(shè)想。

  • 如果模型訓(xùn)練最終還是要根據(jù)數(shù)據(jù)結(jié)構(gòu)做判斷與篩選,那么為什么這件事不能在數(shù)據(jù)采集階段就發(fā)生?

這個問題其實是行業(yè)遲遲沒直面解決的。因為一旦著手解決,就意味著采集邏輯、平臺架構(gòu)、成本結(jié)構(gòu)、人才組織……都得變。

而RoboPocket第一次把它變成了現(xiàn)實。



內(nèi)置一套實時運行的“數(shù)據(jù)價值中樞系統(tǒng)”

相比于過往的UMI設(shè)備,RoboPocket的關(guān)鍵改變集中體現(xiàn)在采集目標(biāo)本身的定義上。

傳統(tǒng)UMI的普遍默認(rèn)采集目標(biāo)是“記錄人類操作行為”。

也就是通過腕部模組、夾爪、軌跡重建等方式,盡可能完整地還原人類執(zhí)行任務(wù)的過程。

在訓(xùn)練初期,這確實能為模型提供基本行為模板。

隨著模型走向更高維度、更長時序、更復(fù)雜場景,記錄動作本身已不足以滿足訓(xùn)練所需

RoboPocket開始嘗試把采集的目標(biāo)轉(zhuǎn)向模型的能力缺口。

模型還不會的,才是最值得采的數(shù)據(jù)。

基于這個理念,RoboPocket系統(tǒng)內(nèi)置了一套實時運行的“數(shù)據(jù)價值中樞系統(tǒng)”

這套系統(tǒng)不再等數(shù)據(jù)采完后才去篩選、分類、評估,而是在采集發(fā)生的當(dāng)下,就開始實時進行判斷。

不難想象,一旦沒有模型視角,采集很容易在堆量的過程中滑向重復(fù)、失真和低價值。

只有知道模型此刻真正需要什么樣的數(shù)據(jù),才有能力搭建好這個中樞系統(tǒng)。

穹徹和上交大盧策吾團隊敢攬這個瓷器活,人家是真有公認(rèn)的金剛鉆。

團隊長期從事具身模型訓(xùn)練與數(shù)據(jù)閉環(huán)研究,既懂單點采集工具(此前推出過多款具身數(shù)據(jù)采集硬件),也懂圍繞具身模型訓(xùn)練、評估與數(shù)據(jù)回流的完整閉環(huán)研究。

他們最清楚哪些軌跡會變成有效訓(xùn)練信號,哪些看起來熱鬧但只會拖慢訓(xùn)練,也更清楚模型在不同任務(wù)維度上的短板通常出在哪里,應(yīng)該用什么樣的樣本去補。

這種能力依賴的不只是工程實現(xiàn),而是對模型的長期理解與持續(xù)驗證,所以很難被復(fù)制。



采集數(shù)據(jù)的過程中,RoboPocket同時在推進并完成三件事——

第一是實時評估

在每一幀數(shù)據(jù)生成時,系統(tǒng)都會判斷采集到的數(shù)據(jù)是否具備有效的訓(xùn)練信號,比如操作是否完整、動作是否在預(yù)期軌跡內(nèi)、場景是否具備信息量。

第二是即時引導(dǎo)。

如果系統(tǒng)檢測到采集者的操作可能低效或錯誤,比如動作過快、夾爪超出操作區(qū)域、多樣性不足等,就會實時發(fā)出提醒,引導(dǎo)采集者進行調(diào)整,避免采到低價值甚至廢棄的數(shù)據(jù)。



第三是動態(tài)調(diào)度。

這一環(huán)節(jié)則直接接入當(dāng)前模型的能力評估結(jié)果。

系統(tǒng)會根據(jù)模型在不同任務(wù)維度上的表現(xiàn),識別出當(dāng)前訓(xùn)練最需要補齊的樣本類型,并實時分發(fā)相應(yīng)的高優(yōu)先級采集任務(wù)給采集者。

說句更好理解的話,RoboPocket就是個24小時stand by的數(shù)據(jù)采集主理人。

它即時診斷每一幀數(shù)據(jù)的質(zhì)量,智能指導(dǎo)甚至糾正采集員動作,實時互動動態(tài)評估數(shù)據(jù)價值,為后處理提供篩選依據(jù)。

這樣一來,在采集階段,數(shù)據(jù)就和訓(xùn)練目標(biāo)保持貼合,顯著減少冗余,訓(xùn)練信號更加集中。

穹徹團隊介紹,RoboPocket采集的數(shù)據(jù)在訓(xùn)練中展現(xiàn)出顯著優(yōu)勢

尤其是在開放復(fù)雜環(huán)境中的多步驟任務(wù)中,模型執(zhí)行的穩(wěn)定性更強,不容易因光照變化、背景變化或任務(wù)干擾而出錯,準(zhǔn)確識別每一步的上下文意圖,在不確定情境下仍保持清晰的目標(biāo)推進邏輯。

無論是精準(zhǔn)完成零食分揀裝袋,還是毛巾折疊整理,模型可以保持穩(wěn)定、高效的協(xié)同作業(yè),展現(xiàn)了卓越的雙臂協(xié)同與長序列操作能力。



此外,在環(huán)境復(fù)雜度提升、干擾增多的場景下,也能維持較高的成功率和一致性。

這顯現(xiàn)出一個重要趨勢

得益于采集過程更貼近真實任務(wù),采集體系增強了訓(xùn)練匹配能力,模型開始從“能夠粗糙地完成任務(wù)”向“能在非理想條件下可靠完成任務(wù)”演進。

而數(shù)據(jù)采集開始成為面向模型能力補齊的持續(xù)行為,這讓數(shù)據(jù)采集開始具備閉環(huán)屬性。

一旦采集與模型訓(xùn)練形成聯(lián)動,整個數(shù)據(jù)系統(tǒng)的運行效率將得到顯著提升。



從堆量走向邊采邊篩,數(shù)據(jù)采集的分水嶺來了

如果放進更長的時間尺度來看,RoboPocket就不能視為一次孤立的產(chǎn)品更新。

機器人學(xué)習(xí)的發(fā)展,本質(zhì)上是一部數(shù)據(jù)采集方式不斷演進的歷史。

最初,機器人只能在實驗室中完成標(biāo)準(zhǔn)任務(wù),數(shù)據(jù)由少數(shù)研究人員在封閉環(huán)境中錄制。

隨著具身智能的發(fā)展,數(shù)據(jù)開始走向規(guī)模化采集場,遙操作與人機協(xié)作帶來大規(guī)模機器人數(shù)據(jù)。

2023年,穹徹智能聯(lián)合上海交通大學(xué)盧策吾團隊共同發(fā)布RH20T,機器人操作數(shù)據(jù)在中國首次實現(xiàn)系統(tǒng)性的規(guī)?;杉?/strong>。但截至這一時期,機器人數(shù)據(jù)采集依然主要依賴預(yù)設(shè)場景。

2024年,斯坦福大學(xué)推出的UMI讓采集設(shè)備更加輕量和簡單,數(shù)據(jù)采集開始轉(zhuǎn)向“自然發(fā)生”。

2025年,穹徹智能推出CoMiner伴隨式數(shù)據(jù)采集系統(tǒng),機器人開始走出采集場,進入真實世界,在開放環(huán)境中獲取更加多樣、復(fù)雜的操作數(shù)據(jù)。

梳理這個過程可以看到,具身數(shù)據(jù)一步步走出搭建的實驗場景,愈來愈貼近現(xiàn)實。

2026年,RoboPocket的出現(xiàn),將機器人數(shù)據(jù)采集,從特定場所與專業(yè)系統(tǒng)徹底釋放到整個社會中。



手機成為節(jié)點,每個普通人可以參與采集。

無可否認(rèn),這是一次采集范式從“專業(yè)體系”走向“社會化網(wǎng)絡(luò)”的轉(zhuǎn)變。

當(dāng)然啦,采什么、怎么采、優(yōu)先級如何,這些都不是由人隨意決定的。

這時候,前端連接真實世界的分散場景,后端連接任務(wù)庫、模型訓(xùn)練與評估系統(tǒng)的RoboPocket,就起到了數(shù)據(jù)入口與調(diào)度中樞的雙角色作用。



正因為有這套持續(xù)在線的判斷與調(diào)度機制,數(shù)據(jù)采集才第一次具備了真正社會化的前提條件。

數(shù)采員可以是每一個普通人,但采集行為始終根據(jù)模型需求由數(shù)據(jù)中樞系統(tǒng)統(tǒng)一牽引調(diào)度。

長期來看,會推動具身數(shù)據(jù)從工具競爭邁向體系競爭。

誰的數(shù)據(jù)采集流程更早地接入模型反饋、誰的任務(wù)設(shè)計天然適配訓(xùn)練目標(biāo),誰就能更快積累泛化能力與落地魯棒性。

行業(yè)普遍認(rèn)為具身智能還在上半場,期待著這個領(lǐng)域和大模型一樣,能夠用暴力美學(xué)帶來能力涌現(xiàn)。



所有人都在往具身模型里扔更多數(shù)據(jù),但真正贏的人,一定率先解決了其它更深層次的問題。

既然如此,對想要持續(xù)scale up的具身智能行業(yè)來說,數(shù)據(jù)采集從源頭就對齊目標(biāo)就是一場遲早會發(fā)生的機制變動。

因為未來模型之間的差距,很可能就源于數(shù)據(jù)閉環(huán)的建設(shè)深度。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
世界杯首支淘汰賽球隊誕生,墨西哥晉級,韓國門將失誤拱手送分

世界杯首支淘汰賽球隊誕生,墨西哥晉級,韓國門將失誤拱手送分

歷史膠囊
2026-06-19 16:00:46
“不理解但尊重”,家長打扮粉嫩幼態(tài)送娃上學(xué),網(wǎng)友:很不得體

“不理解但尊重”,家長打扮粉嫩幼態(tài)送娃上學(xué),網(wǎng)友:很不得體

蝴蝶花雨話教育
2026-06-03 00:05:12
新華社:不要讓機關(guān)事業(yè)單位中的“官油子”得勢得利!

新華社:不要讓機關(guān)事業(yè)單位中的“官油子”得勢得利!

職場資深秘書
2026-06-19 13:02:51
“甘油三酯大戶”被揪出,提醒:50歲后,這7種食物建議少吃

“甘油三酯大戶”被揪出,提醒:50歲后,這7種食物建議少吃

岐黃傳人孫大夫
2026-06-18 20:35:05
從中國兩次錯失安達礁駐軍良機看南海局勢,萬幸南沙有今天的局面

從中國兩次錯失安達礁駐軍良機看南海局勢,萬幸南沙有今天的局面

音樂時光的娛樂
2026-06-19 13:16:51
武昌火車站因暴雨被淹,有積水到達腳踝位置,車站工作人員:東西出站口已恢復(fù)正常,如果雨下得大還會積水

武昌火車站因暴雨被淹,有積水到達腳踝位置,車站工作人員:東西出站口已恢復(fù)正常,如果雨下得大還會積水

大風(fēng)新聞
2026-06-19 12:03:02
“我有女朋友了”!哈佛SUV滿車女友頭像,“贛E”車牌悄然登熱搜

“我有女朋友了”!哈佛SUV滿車女友頭像,“贛E”車牌悄然登熱搜

火山詩話
2026-06-19 11:51:30
手握247萬噸鉬礦+磷化銦,低位潛力標(biāo)的浮出

手握247萬噸鉬礦+磷化銦,低位潛力標(biāo)的浮出

時尚的弄潮
2026-06-19 09:56:21
一位清華教授曾直言:過去三十年搞房地產(chǎn),賺的都是斷子絕孫的錢

一位清華教授曾直言:過去三十年搞房地產(chǎn),賺的都是斷子絕孫的錢

無意爭春
2026-06-02 20:45:10
余承東回家過端午被拍,坐尊界S800,無助理攝影師,雷軍躺著中槍

余承東回家過端午被拍,坐尊界S800,無助理攝影師,雷軍躺著中槍

譚談社會
2026-06-18 19:18:56
關(guān)之琳素顏游西安被偶遇,白發(fā)清晰可見,和漢服女孩同框反差太大

關(guān)之琳素顏游西安被偶遇,白發(fā)清晰可見,和漢服女孩同框反差太大

看盡落塵花q
2026-06-19 14:16:49
誤報梅西父親去世!阿根廷女主播直播“翻車”,道歉后辭職

誤報梅西父親去世!阿根廷女主播直播“翻車”,道歉后辭職

紅星新聞
2026-06-19 09:06:34
布達拉宮剖開內(nèi)部圖看懂:為啥有人逛著會覺得陰森壓抑

布達拉宮剖開內(nèi)部圖看懂:為啥有人逛著會覺得陰森壓抑

西樓知趣雜談
2026-06-13 19:18:15
曹德旺交卷了!福耀科技大學(xué)憑硬實力出圈,傳統(tǒng)高校該反思了

曹德旺交卷了!福耀科技大學(xué)憑硬實力出圈,傳統(tǒng)高校該反思了

復(fù)轉(zhuǎn)這些年
2026-06-15 18:49:23
圖赫爾太神了!英格蘭頭號水貨一戰(zhàn)封神,全英球迷排隊道歉

圖赫爾太神了!英格蘭頭號水貨一戰(zhàn)封神,全英球迷排隊道歉

瀾歸序
2026-06-19 06:07:02
梅西紅牌爭議再發(fā)酵!更多賽場細節(jié)被曝光,央視態(tài)度早已說明一切

梅西紅牌爭議再發(fā)酵!更多賽場細節(jié)被曝光,央視態(tài)度早已說明一切

天天熱點見聞
2026-06-19 03:45:59
豐田新發(fā)動機一箱油跑1200公里,如今敗給中企,豐田章男不再孤獨

豐田新發(fā)動機一箱油跑1200公里,如今敗給中企,豐田章男不再孤獨

王新喜
2026-06-18 21:04:12
享界新車尾標(biāo)變更為北汽集團 內(nèi)部人士:正在為漸進式獨立做準(zhǔn)備

享界新車尾標(biāo)變更為北汽集團 內(nèi)部人士:正在為漸進式獨立做準(zhǔn)備

快科技
2026-06-18 16:30:14
加拿大球員重傷下場,日本球迷表態(tài),這是中國不敢踢世界杯的原因

加拿大球員重傷下場,日本球迷表態(tài),這是中國不敢踢世界杯的原因

酷侃體壇
2026-06-19 15:57:31
大媽順走奔馳螺絲后續(xù):監(jiān)控拍下長相,被找到后說:以為你不要了

大媽順走奔馳螺絲后續(xù):監(jiān)控拍下長相,被找到后說:以為你不要了

天天熱點見聞
2026-06-19 03:44:33
2026-06-19 16:32:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12818文章數(shù) 176500關(guān)注度
往期回顧 全部

科技要聞

Anthropic被禁,智譜卻漲瘋了

頭條要聞

男子醉駕撞死16歲少女 最初被認(rèn)定全責(zé)復(fù)議后變主責(zé)

頭條要聞

男子醉駕撞死16歲少女 最初被認(rèn)定全責(zé)復(fù)議后變主責(zé)

體育要聞

加拿大球員小腿變形重傷 亞洲冠軍輸球輸人

娛樂要聞

吳倩自曝小時被爸爸打掉牙齒硬吞進肚

財經(jīng)要聞

Token低價陷阱

汽車要聞

驚出冷汗!重慶實測奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

本地
家居
教育
數(shù)碼
公開課

本地新聞

世界杯黑馬佛得角:河北人開超市,溫州人當(dāng)老板

家居要聞

綠意盎然 自然之境

教育要聞

第31課-飛機上,如何讓外國人愿意跟你換座位?

數(shù)碼要聞

定義未來賽道:京東方如何用630億重塑中尺寸OLED底牌?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版