網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

地瓜機(jī)器人攜手虛時(shí)科技，補(bǔ)上具身智能的仿真數(shù)據(jù)“黑洞”｜甲子光年

2026-05-12 13:51:39　來(lái)源: 甲子光年

北京舉報(bào)

分享至

重構(gòu)仿真數(shù)據(jù)的生產(chǎn)方式。

作者｜劉楊楠

編輯｜栗子

5月12日，虛時(shí)科技（Intime AI）與地瓜機(jī)器人聯(lián)合開(kāi)發(fā)的首款仿真空間數(shù)據(jù)生成平臺(tái)——AnySceneGen正式發(fā)布。

這是一個(gè)面向具身智能訓(xùn)練的仿真空間生成平臺(tái)。用戶可以基于多模態(tài)輸入，快速生成對(duì)應(yīng)的三維仿真場(chǎng)景，場(chǎng)景中所有物體自帶完整的物理屬性，可直接導(dǎo)入Isaac Sim、MuJoCo等主流仿真平臺(tái)，用于機(jī)器人訓(xùn)練、評(píng)測(cè)與數(shù)據(jù)采集。

AnySceneGen平臺(tái)產(chǎn)品界面

這場(chǎng)合作真正值得關(guān)注的，是它直指一個(gè)被反復(fù)提及，卻遲遲無(wú)解的行業(yè)難題。

過(guò)去兩年，具身智能對(duì)訓(xùn)練數(shù)據(jù)的需求進(jìn)入指數(shù)級(jí)增長(zhǎng)階段。仿真數(shù)據(jù)理論上可以突破真實(shí)采集的物理限制，通過(guò)算力并行無(wú)限擴(kuò)展，且邊際成本隨規(guī)模遞減。

但現(xiàn)實(shí)中，除了備受關(guān)注Sim2Real Gap問(wèn)題外，真正可用于仿真的空間環(huán)境（Sim-ready 3D scene）的供給方式還停留在手工作坊時(shí)代。建模師逐個(gè)制作資產(chǎn)，手動(dòng)搭建場(chǎng)景，再逐一配置物理參數(shù)。這套流程的成本和效率，讓仿真數(shù)據(jù)規(guī)?；a(chǎn)的理論優(yōu)勢(shì)始終無(wú)法兌現(xiàn)。

虛時(shí)科技要做的，就是打破這個(gè)局面。

虛時(shí)科技成立于2024年下半年，是一家專注于打造物理AI時(shí)代數(shù)據(jù)基礎(chǔ)設(shè)施的初創(chuàng)公司，目前已獲得奇績(jī)創(chuàng)壇、宇跡科創(chuàng)的種子輪投資。

他們的切入點(diǎn)正是仿真空間規(guī)?；a(chǎn)的底層難題——用模型替代人工，重構(gòu)整個(gè)仿真數(shù)據(jù)的供給方式。

1.重構(gòu)仿真數(shù)據(jù)的生產(chǎn)方式

當(dāng)前，具身智能已經(jīng)全面進(jìn)入數(shù)據(jù)驅(qū)動(dòng)階段。

過(guò)去一年，國(guó)內(nèi)人形機(jī)器人公司密集融資，各家廠商的硬件能力快速迭代，Demo演示越來(lái)越流暢。但進(jìn)入真實(shí)場(chǎng)景后，機(jī)器人往往容易“翻車”。因?yàn)檎鎸?shí)環(huán)境千變?nèi)f化，光照、物體擺放角度、背景干擾、沒(méi)見(jiàn)過(guò)的新物體，任何一個(gè)變量超出訓(xùn)練分布，模型就可能崩潰。

要讓模型具備這種泛化能力，需要的是海量、多樣化、覆蓋長(zhǎng)尾場(chǎng)景的訓(xùn)練數(shù)據(jù)。

在具身智能可用的訓(xùn)練數(shù)據(jù)構(gòu)成中，真實(shí)遙操作數(shù)據(jù)是機(jī)器人理解物理世界最直接的基準(zhǔn)，對(duì)于模型校準(zhǔn)不可或缺。

但它的局限性同樣顯而易見(jiàn)。

每一條有效數(shù)據(jù)背后，是工程師輪班、設(shè)備損耗和場(chǎng)地限制，人力和硬件成本高昂。同時(shí)，危險(xiǎn)場(chǎng)景和長(zhǎng)尾場(chǎng)景天然難以覆蓋，并且無(wú)法適配強(qiáng)化學(xué)習(xí)、評(píng)測(cè)等環(huán)節(jié)，采集到的數(shù)據(jù)涵蓋的物理信息也非常有限，可交互性較差。

更致命的是，這種方式的采集成本遵循線性增長(zhǎng)邏輯。數(shù)據(jù)量每增加一個(gè)數(shù)量級(jí)，需要投入的人力和時(shí)間近乎等比例上升。這意味著真機(jī)數(shù)據(jù)更適合早期少數(shù)任務(wù)驗(yàn)證。一旦涉及規(guī)模化落地，這種方式的成本高不可及。

今年，雖然一些公司已經(jīng)定下了全年采集百萬(wàn)小時(shí)級(jí)數(shù)據(jù)集的目標(biāo)，但對(duì)于打造通用機(jī)器人的終極遠(yuǎn)景，這個(gè)體量還遠(yuǎn)遠(yuǎn)不夠。

仿真數(shù)據(jù)也因此被推到臺(tái)前。它的優(yōu)勢(shì)很直觀，可通過(guò)并行算力規(guī)?；瘮U(kuò)展，場(chǎng)景變量更加可控，能批量生成真機(jī)難以獲取的因果維度訓(xùn)練樣本。

對(duì)此，學(xué)界和產(chǎn)業(yè)界已有代表性案例。今年4月，蘇度科技發(fā)布軟硬件全棧自研的機(jī)器人系統(tǒng)Sudo R1，采用世界模型與強(qiáng)化學(xué)習(xí)一體化設(shè)計(jì)，在不使用任何真機(jī)數(shù)據(jù)的前提下，實(shí)現(xiàn)了關(guān)鍵任務(wù)近100%的Zero-shot成功率。

這個(gè)案例足以證明，仿真數(shù)據(jù)的價(jià)值上限，遠(yuǎn)未被觸達(dá)。

但一個(gè)容易被忽視的悖論是，仿真數(shù)據(jù)本應(yīng)突破真實(shí)數(shù)據(jù)采集的規(guī)?；款i，可在現(xiàn)有生產(chǎn)流程中，能夠用于閉環(huán)交互、實(shí)驗(yàn)和數(shù)據(jù)采集的仿真空間，仍主要依賴人工建模、人工布置和人工配置物理參數(shù)，其生產(chǎn)方式尚未實(shí)現(xiàn)規(guī)?；?。

還原一下傳統(tǒng)仿真數(shù)據(jù)生產(chǎn)流程，就能看到問(wèn)題所在。

當(dāng)前，雖然有各種基于生成或者重建的技術(shù)路徑，但要么缺失空間智能，仍需依賴人工擺放；要么缺乏可交互能力。最終，行業(yè)常見(jiàn)做法仍是由建模師手工制作，調(diào)取或者生成多個(gè)3D資產(chǎn)，再把資產(chǎn)逐個(gè)擺放成空間場(chǎng)景，導(dǎo)入Isaac Sim、MuJoCo等仿真器，最后手動(dòng)為每個(gè)物體配置材質(zhì)、質(zhì)量、摩擦系數(shù)等物理參數(shù)。

整個(gè)建模過(guò)程中，每一步都需要專業(yè)人員參與，且效率同樣呈線性增長(zhǎng)。一個(gè)有經(jīng)驗(yàn)的建模師一天只能搭出少量可用場(chǎng)景，如果要生成100個(gè)布局不同的廚房，時(shí)間成本幾乎是單個(gè)廚房的100倍。

如果企業(yè)沿用傳統(tǒng)人工建模方法，在超大規(guī)模需求下，邊際成本將急劇上升。如果仿真數(shù)據(jù)的生產(chǎn)方式不變，其在模型訓(xùn)練中的效率優(yōu)勢(shì)就永遠(yuǎn)停留在理論上。

這便是虛時(shí)科技正在撬動(dòng)的杠桿。

2.Code-to-Space：規(guī)?；┙o仿真數(shù)據(jù)的新范式

創(chuàng)業(yè)前，王德駪對(duì)技術(shù)方向已有充分的系統(tǒng)性思考。此前，在亞馬遜Alexa擔(dān)任大模型組技術(shù)負(fù)責(zé)人期間，王德駪曾負(fù)責(zé)LLM的開(kāi)發(fā)和部署，帶領(lǐng)數(shù)十人研發(fā)團(tuán)隊(duì)，服務(wù)全球約6億用戶。

虛時(shí)科技CEO王德駪

過(guò)去幾年，AI領(lǐng)域的熱點(diǎn)仍聚焦在語(yǔ)言模型、圖像生成和多模態(tài)理解上，“空間智能”和“世界模型”尚未成為行業(yè)共識(shí)。但基于在大模型一線研發(fā)和產(chǎn)業(yè)落地中的經(jīng)驗(yàn)，王德駪很早形成了一個(gè)方向性判斷。

在他看來(lái)，今天的AI之所以能在文本、圖像等二維信息的理解與生成上逼近甚至超越人類，是因?yàn)榛ヂ?lián)網(wǎng)積累了海量的數(shù)字化語(yǔ)料和視覺(jué)數(shù)據(jù)。但人類智能從來(lái)不只是閱讀文字和觀看圖像的結(jié)果，更關(guān)鍵的一部分能力，是在與物理世界進(jìn)行交互、感知、操控和反饋的閉環(huán)中塑造出來(lái)的。

這意味著，如果AI真的要邁向通用，它就不能永遠(yuǎn)停留在屏幕里處理符號(hào)。它必須走出二維信息的繭房，進(jìn)入三維的、有重力、有摩擦、有碰撞的物理世界，去理解空間、結(jié)構(gòu)、尺度、材質(zhì)和物理約束等更高維的信息。

而今天被行業(yè)反復(fù)討論的物理AI，本質(zhì)上也正是在回應(yīng)一個(gè)問(wèn)題——如何讓AI從理解數(shù)字世界，走向理解物理世界，并在物理世界中完成感知、交互和決策。

沿著這個(gè)方向推演，物理AI當(dāng)前最核心的落地場(chǎng)景，無(wú)疑是具身智能。王德駪明確判斷，仿真數(shù)據(jù)固然是當(dāng)前機(jī)器人訓(xùn)練中成本最低、產(chǎn)能最大的數(shù)據(jù)路線。但前提是，仿真數(shù)據(jù)的生產(chǎn)本身必須從傳統(tǒng)的人工主導(dǎo)轉(zhuǎn)向模型驅(qū)動(dòng)。

理論上，大模型是規(guī)模化生成這類數(shù)據(jù)的最佳候選。但受限于當(dāng)前語(yǔ)言和視覺(jué)模型的訓(xùn)練方式，模型并不具備理解和生成三維空間所需的“空間智能”。

此前，讓模型學(xué)習(xí)空間智能的一種思路，是通過(guò)“重建+表征學(xué)習(xí)”提高模型的空間理解能力，但這難以讓模型真正學(xué)習(xí)空間構(gòu)造的底層邏輯，因此也難以形成真正的空間智能。

是否能基于大語(yǔ)言模型的底層能力，走一條更符合空間智能形成機(jī)制的路徑？這正是王德駪技術(shù)構(gòu)想的起點(diǎn)。

我們?nèi)粘Ｋ幍拇罅靠臻g，本質(zhì)上都是由人類設(shè)計(jì)、建造和使用經(jīng)驗(yàn)共同塑造出來(lái)的“人造空間”，內(nèi)含一套可被拆解、抽象和復(fù)用的結(jié)構(gòu)化邏輯。

專業(yè)建模過(guò)程，則是這套空間構(gòu)造邏輯在數(shù)字世界中的顯性表達(dá)。一個(gè)建模人員會(huì)先理解空間的功能、尺度、結(jié)構(gòu)和關(guān)系，再逐步完成資產(chǎn)建模、布局組織、材質(zhì)處理和可用性校驗(yàn)，不只是簡(jiǎn)單復(fù)刻空間的外觀。

在王德駪看來(lái)，這本質(zhì)上就是在空間生成領(lǐng)域的一條“思維鏈（CoT）”。

語(yǔ)言模型已被驗(yàn)證能夠沿思維鏈學(xué)會(huì)深度推理，只要將人類構(gòu)造空間的思維過(guò)程解構(gòu)并重組，形成一套專屬于空間構(gòu)造的“CoT”，模型就能學(xué)會(huì)隱藏在人類建模背后的空間構(gòu)造邏輯，進(jìn)而讓模型涌現(xiàn)出真正的“空間智能”。

空間生成能力跑通后，下一個(gè)挑戰(zhàn)是，生成結(jié)果如何規(guī)?；度刖呱碇悄艿挠?xùn)練管線？

機(jī)器人需要在場(chǎng)景中進(jìn)行千萬(wàn)次試錯(cuò)，每一次反饋都可能要求調(diào)整場(chǎng)景中的某個(gè)變量，而大模型的生成能力自帶隨機(jī)性，很難在這種高交互密度的訓(xùn)練管線中靈活應(yīng)變。

如何實(shí)現(xiàn)生成結(jié)果的高可控性？

虛時(shí)科技更進(jìn)一步，以代碼作為輸出，模型不直接輸出3D視覺(jué)結(jié)果，而是生成建模過(guò)程對(duì)應(yīng)的可執(zhí)行代碼，再將代碼編譯成最終的3D空間資產(chǎn)和場(chǎng)景——這是虛時(shí)科技最具突破性的創(chuàng)新。代碼本身可檢查、可修改、可約束、可迭代的特性，能夠天然適配具身訓(xùn)練對(duì)場(chǎng)景變量的精細(xì)控制要求。

最終，虛時(shí)科技形成了獨(dú)創(chuàng)的Code-to-Space技術(shù)方案以及自研空間智能模型，通過(guò)深度發(fā)掘空間感知層背后的空間結(jié)構(gòu)、尺度關(guān)系、功能邏輯、交互方式和物理約束等空間信息，并將其壓縮成可推理、可編輯、可執(zhí)行的結(jié)構(gòu)化表示，從而規(guī)?；筛哔|(zhì)量、高可控性的仿真空間。

這套技術(shù)方案的核心優(yōu)勢(shì)有三個(gè)層面：

第一，資產(chǎn)獨(dú)立可編輯。基于mesh的結(jié)構(gòu)化表達(dá)，桌子是桌子，杯子是杯子，可以像搭積木一樣自由移動(dòng)、替換。而基于3D高斯?jié)姙R或NeRF等隱式表征路線生成的3D空間，所有資產(chǎn)和空間粘連在一起，作為一個(gè)整體模型存在，無(wú)法進(jìn)行分離、編輯和獨(dú)立控制。

第二，生成空間自帶物理屬性。模型通過(guò)數(shù)值化參數(shù)生成精準(zhǔn)材質(zhì)，例如透明度、折射率、反光率、粗糙度、金屬度等。在此基礎(chǔ)上，模型中的生成式物理仿真模塊進(jìn)一步結(jié)合資產(chǎn)幾何、材質(zhì)和空間上下文，預(yù)測(cè)重量、摩擦系數(shù)、碰撞相關(guān)參數(shù)等物理屬性，并自動(dòng)寫(xiě)入U(xiǎn)SD等通用仿真文件格式。傳統(tǒng)仿真流程中需要人工手動(dòng)配置的環(huán)節(jié)，被全面自動(dòng)化。

第三，可規(guī)?；夯?。傳統(tǒng)基于掃描重建的數(shù)字孿生技術(shù)，本質(zhì)上只能還原已有世界。而Code-to-Space不僅能還原特定場(chǎng)景，還能批量生成布局不同但空間合理的場(chǎng)景變體。這恰好切中了具身預(yù)訓(xùn)練對(duì)場(chǎng)景多樣性的核心需求。

從更底層的視角看，Code-to-Space本質(zhì)是對(duì)仿真空間生產(chǎn)范式的變革。

傳統(tǒng)3D軟件的可視化界面，本質(zhì)上是面向建模師開(kāi)發(fā)的操作層。用戶在界面上的每一次操作，最終都需要通過(guò)底層代碼被執(zhí)行；而Code-to-Space是面向大模型、面向Agent開(kāi)發(fā)的空間生成方式，由模型直接生成底層代碼，并將其映射為可編輯、可交互、具備物理屬性的仿真空間。

技術(shù)路徑跑通后，公司開(kāi)始思考如何將這套方案推向產(chǎn)業(yè)。

這正是王云峰加入虛時(shí)科技出任COO的核心原因。王云峰的履歷橫跨互聯(lián)網(wǎng)和AI兩個(gè)時(shí)代，他是搜狗搜索的核心創(chuàng)始成員之一，曾與王小川等五位聯(lián)創(chuàng)共同打造搜狗搜索，擔(dān)任過(guò)搜索架構(gòu)負(fù)責(zé)人、阿里云高級(jí)專家。加入虛時(shí)科技前，王云峰曾任上市公司值得買(mǎi)科技CTO，并主導(dǎo)其AI應(yīng)用研究院的技術(shù)建設(shè)與應(yīng)用探索。

虛時(shí)科技COO王云峰

正因?yàn)橥暾?jīng)歷過(guò)搜索引擎、推薦系統(tǒng)、大語(yǔ)言模型三個(gè)技術(shù)周期，王云峰對(duì)數(shù)據(jù)基礎(chǔ)設(shè)施的價(jià)值有切身體會(huì)。這些技術(shù)的崛起，本質(zhì)上都建立在大規(guī)模、高質(zhì)量數(shù)據(jù)供給之上。物理AI要發(fā)展，回到最底層，同樣需要先解決“數(shù)據(jù)從哪里來(lái)”的問(wèn)題?！罢鎸?shí)世界數(shù)據(jù)太貴、太慢、太難覆蓋長(zhǎng)尾場(chǎng)景，仿真數(shù)據(jù)生產(chǎn)又過(guò)度依賴人工，這里面一定會(huì)出現(xiàn)新的平臺(tái)型公司?！蓖踉品灞硎?。

因此，他加入虛時(shí)科技，正是要將Code-to-Space這條技術(shù)路徑，轉(zhuǎn)化為物理AI時(shí)代的數(shù)據(jù)生產(chǎn)基礎(chǔ)設(shè)施，推向商業(yè)市場(chǎng)。

目前，團(tuán)隊(duì)分工明確：王德駪負(fù)責(zé)整體方向、核心技術(shù)研發(fā)與模型路線判斷；王云峰負(fù)責(zé)商務(wù)、運(yùn)營(yíng)與外部合作的整體推進(jìn)。一個(gè)主攻技術(shù)深度，一個(gè)主攻產(chǎn)業(yè)落地，形成互補(bǔ)。

3.聯(lián)手地瓜，完成關(guān)鍵下游驗(yàn)證

2025年底，地瓜機(jī)器人關(guān)注到了虛時(shí)科技的技術(shù)與下游適配性。

整體來(lái)看，地瓜機(jī)器人有三大核心業(yè)務(wù)板塊：芯片（硬件底座）、機(jī)器人平臺(tái)能力（算法）、開(kāi)發(fā)者生態(tài)（數(shù)據(jù)、工具）。這一布局某種程度上對(duì)標(biāo)了英偉達(dá)“芯片+Omniverse+Newton生態(tài)”的架構(gòu)。

在這套架構(gòu)中，數(shù)據(jù)是連接硬件底座與算法能力的關(guān)鍵一環(huán)，直接決定了開(kāi)發(fā)者生態(tài)的完整性和可用性。地瓜機(jī)器人也一直在尋找能夠在這個(gè)環(huán)節(jié)進(jìn)行更深戰(zhàn)略布局的機(jī)會(huì)。

對(duì)地瓜機(jī)器人而言，仿真數(shù)據(jù)一直是內(nèi)部算法研發(fā)的重要基礎(chǔ)，也是完善下游開(kāi)發(fā)者生態(tài)、服務(wù)下游客戶的關(guān)鍵能力之一。問(wèn)題在于，能夠規(guī)?；┙o高質(zhì)量仿真數(shù)據(jù)的方案長(zhǎng)期缺位。正是在這個(gè)背景下，虛時(shí)科技進(jìn)入了地瓜機(jī)器人的視野。

地瓜機(jī)器人具身智能算法負(fù)責(zé)人何泳澔看重的，除了單個(gè)仿真空間的生成質(zhì)量，還有仿真空間生成的多樣性和泛化能力。

在他看來(lái)，具身智能訓(xùn)練需要兩類數(shù)據(jù)，一是少量高精度場(chǎng)景，用于精細(xì)化調(diào)試；二是大規(guī)模、低成本、覆蓋不同空間尺度、物體組合、布局關(guān)系、任務(wù)條件和長(zhǎng)尾情況的泛化數(shù)據(jù)，用于預(yù)訓(xùn)練階段的模型泛化能力建設(shè)。

許多廠商能夠憑借前者打造出精美的機(jī)器人Demo，但后者的供給長(zhǎng)期嚴(yán)重匱乏，這也正是機(jī)器人在真實(shí)場(chǎng)景中落地困難重重的根源所在。

他進(jìn)一步指出，具身模型的訓(xùn)練，尤其是預(yù)訓(xùn)練階段，數(shù)據(jù)的多樣性遠(yuǎn)比重建精度更重要。而多數(shù)仿真數(shù)據(jù)生成方案始終無(wú)法同時(shí)滿足“可生成、可編輯、可仿真、可規(guī)模化、可泛化”這五個(gè)條件，可這恰恰是仿真數(shù)據(jù)真正大規(guī)模進(jìn)入訓(xùn)練管線的硬性門(mén)檻。

雙方接觸后，地瓜發(fā)現(xiàn)，虛時(shí)科技的Code-to-Space路徑在這五個(gè)關(guān)鍵環(huán)節(jié)上形成了完整閉環(huán)?！皬奈覀兡壳敖佑|和驗(yàn)證過(guò)的技術(shù)路徑來(lái)看，虛時(shí)科技的Code-to-Space是目前少數(shù)，甚至可以說(shuō)是唯一真正能夠同時(shí)兼顧高質(zhì)量空間生成、物理屬性生成、可編輯性和規(guī)?；慨a(chǎn)的仿真空間生成方案?！焙斡緷槐硎?。

3D仿真空間生成效果圖

基于這一判斷，雙方從數(shù)據(jù)驗(yàn)證走向平臺(tái)共建，決定聯(lián)合開(kāi)發(fā)3D仿真空間生成平臺(tái)。

當(dāng)時(shí)，虛時(shí)科技剛完成Code-to-Space從0到1的技術(shù)驗(yàn)證，正處于從技術(shù)走向市場(chǎng)的關(guān)鍵階段。對(duì)虛時(shí)科技而言，相比將數(shù)據(jù)賣(mài)給單一公司，更理想的模式是確立規(guī)模化生產(chǎn)仿真數(shù)據(jù)的技術(shù)標(biāo)桿，占據(jù)更普適的生態(tài)位入口，將數(shù)據(jù)以平臺(tái)化方式持續(xù)供給更多下游企業(yè)。

達(dá)成共識(shí)后，雙方開(kāi)始了為期三個(gè)月的技術(shù)驗(yàn)證。地瓜機(jī)器人的算法團(tuán)隊(duì)對(duì)生成質(zhì)量、流程穩(wěn)定性、物理屬性可用性和格式兼容性進(jìn)行了反復(fù)測(cè)試。

今年3月，雙方簽訂戰(zhàn)略合作協(xié)議，正式啟動(dòng)平臺(tái)開(kāi)發(fā)。

合作過(guò)程中，雙方分工明確，形成優(yōu)勢(shì)互補(bǔ)。地瓜主要提供具身算法、工具鏈和開(kāi)發(fā)平臺(tái)能力；虛時(shí)科技主要提供仿真空間生成模型，規(guī)?；勺詭锢韺傩缘姆抡鏀?shù)據(jù)。

5月12日，AnySceneGen Beta版本正式上線。

AnySceneGen的核心目標(biāo)，是為具身智能仿真訓(xùn)練批量化生成可閉環(huán)交互的仿真空間。用戶可基于多模態(tài)輸入快速生成不同類型的仿真空間，結(jié)合自身訓(xùn)練需求采集合成數(shù)據(jù)并進(jìn)行模型訓(xùn)練。

在技術(shù)架構(gòu)上，AnySceneGen平臺(tái)采用基于mesh的結(jié)構(gòu)化輸出方案，相較于NeRF、3DGS等技術(shù)路徑，更適用于機(jī)器人仿真訓(xùn)練、物理交互與可執(zhí)行任務(wù)建模。

同時(shí)，AnySceneGen生成的場(chǎng)景具備高度可控和可編輯能力。開(kāi)發(fā)者可根據(jù)訓(xùn)練需求，靈活調(diào)整空間布局、物體屬性、交互邏輯、材質(zhì)風(fēng)格以及任務(wù)約束，快速構(gòu)造具備多樣性與泛化性的仿真訓(xùn)練環(huán)境。

此外，平臺(tái)生成的空間不僅具備高質(zhì)量視覺(jué)屬性，也在生成過(guò)程中自動(dòng)生成并寫(xiě)入碰撞體、物理材質(zhì)、尺度關(guān)系、運(yùn)動(dòng)約束等物理屬性信息，可進(jìn)一步提升機(jī)器人在仿真環(huán)境中的交互真實(shí)性與訓(xùn)練穩(wěn)定性，為后續(xù)Sim2Real泛化提供更有效的數(shù)據(jù)基礎(chǔ)。

目前，平臺(tái)已經(jīng)深度集成虛時(shí)科技InteriorGen與地瓜機(jī)器人的TabletopGen能力，可生成桌面級(jí)與室內(nèi)級(jí)仿真空間。

基于AnySceneGen，地瓜機(jī)器人的具身團(tuán)隊(duì)也已開(kāi)始生成兩類仿真數(shù)據(jù)：一類是Loco-manipulation，涉及硬件本體在仿真場(chǎng)景中的導(dǎo)航和操作數(shù)據(jù)；另一類是空間感知，涉及多目異構(gòu)相機(jī)在空間中的深度或點(diǎn)云真值。

截至目前，前者已經(jīng)生成超過(guò)100萬(wàn)episodes，后者已經(jīng)生產(chǎn)超過(guò)1000萬(wàn)幀。

AnySceneGen平臺(tái)生成的仿真空間

接下來(lái)，平臺(tái)會(huì)分階段推進(jìn)場(chǎng)景覆蓋能力——從桌面級(jí)場(chǎng)景和家庭空間起步，逐步延伸至辦公場(chǎng)所、工廠、超市、商業(yè)區(qū)等室內(nèi)場(chǎng)景?，F(xiàn)階段，平臺(tái)重點(diǎn)聚焦機(jī)器人操作任務(wù)，后續(xù)將進(jìn)一步支持導(dǎo)航與操作結(jié)合的復(fù)合任務(wù)，為下游開(kāi)發(fā)者提供更豐富的訓(xùn)練場(chǎng)景支撐。

虛時(shí)科技仿真空間生成案例圖

值得注意的是，AnySceneGen核心交付的是一套按需生成、持續(xù)供給的仿真數(shù)據(jù)生成能力。AnySceneGen的定位，更像是具身智能訓(xùn)練體系中的上游數(shù)據(jù)生成平臺(tái)。

客觀來(lái)看，這是一次典型的雙贏。

地瓜機(jī)器人增強(qiáng)了自身開(kāi)發(fā)者生態(tài)中數(shù)據(jù)供給的環(huán)節(jié)，進(jìn)一步完善了“芯片+算法+開(kāi)發(fā)者生態(tài)”的全鏈路布局。

虛時(shí)科技則在完成技術(shù)自證后，獲得了一份來(lái)自頭部生態(tài)玩家的關(guān)鍵產(chǎn)業(yè)認(rèn)可。這并非偶然，而是其技術(shù)路線、生態(tài)位選擇和下游驗(yàn)證積累的一次集中兌現(xiàn)。

4.占據(jù)物理AI的基礎(chǔ)設(shè)施入口

AnySceneGen上線，是虛時(shí)科技的商業(yè)化起點(diǎn)，但遠(yuǎn)不是終點(diǎn)。

當(dāng)前，具身智能訓(xùn)練的不同階段對(duì)數(shù)據(jù)的需求正在分化。預(yù)訓(xùn)練階段需要足夠多樣化的場(chǎng)景數(shù)據(jù)來(lái)提升泛化能力，這是仿真數(shù)據(jù)優(yōu)勢(shì)最明顯的環(huán)節(jié)；后訓(xùn)練或微調(diào)階段則需要可控變量、長(zhǎng)尾場(chǎng)景和失敗案例來(lái)進(jìn)行系統(tǒng)評(píng)測(cè)和提升，仿真數(shù)據(jù)同樣是有力補(bǔ)充。

長(zhǎng)期來(lái)看，下游需求的細(xì)化將一步步倒逼上游數(shù)據(jù)供給體系加速產(chǎn)業(yè)分工。

「甲子光年」梳理發(fā)現(xiàn)，具身智能仿真訓(xùn)練數(shù)據(jù)的供給體系正在加速分層，大致可以劃分為三層。

最上游是仿真空間生成，負(fù)責(zé)按訓(xùn)練需求規(guī)?；a(chǎn)出帶物理屬性的3D場(chǎng)景，直接決定數(shù)據(jù)供給的產(chǎn)能上限；中間層是仿真器，如Isaac Sim、MuJoCo等，承擔(dān)物理計(jì)算與傳感器渲染任務(wù)，目前這一層格局已相對(duì)成熟；最下游是具身訓(xùn)練，由機(jī)器人廠商和算法團(tuán)隊(duì)基于任務(wù)需求，將仿真數(shù)據(jù)導(dǎo)入訓(xùn)練管線。

過(guò)去，這三層之間的協(xié)作高度耦合，仿真場(chǎng)景嚴(yán)重依賴人工定制，生產(chǎn)效率低下，迫使許多下游廠商不得不自建數(shù)據(jù)團(tuán)隊(duì)，重復(fù)投入?yún)s難以規(guī)模化。

而隨著仿真數(shù)據(jù)的戰(zhàn)略價(jià)值被行業(yè)廣泛認(rèn)可，三層之間的專業(yè)化分工正在加速，尤其是上游仿真空間生成環(huán)節(jié)，正在成為一個(gè)獨(dú)立的、平臺(tái)化的新機(jī)會(huì)。

虛時(shí)科技選擇切入的，正是這一環(huán)節(jié)。

公司基于Code-to-Space路徑自研的空間智能模型，將傳統(tǒng)人工仿真數(shù)據(jù)生產(chǎn)流程轉(zhuǎn)化為模型驅(qū)動(dòng)的平臺(tái)化供給能力，規(guī)?；勺銐蚍夯?、具備物理屬性、可編輯、可交互的3D仿真場(chǎng)景。

這也決定了，虛時(shí)科技與市面上一些仿真數(shù)據(jù)供應(yīng)商有本質(zhì)區(qū)別。

多數(shù)供應(yīng)商的核心模式，是圍繞具身智能的具體任務(wù)，組織人力或半自動(dòng)化地生產(chǎn)仿真數(shù)據(jù)，本質(zhì)上解決的是“交付數(shù)據(jù)”的問(wèn)題。而虛時(shí)科技的核心優(yōu)勢(shì)，是完成了從“人工交付數(shù)據(jù)”到“模型生成空間”的關(guān)鍵跨越，形成了一套可規(guī)?；煞抡婵臻g的底層模型能力。

這意味著，仿真數(shù)據(jù)并非這套模型能力的全部，而是其在具身智能訓(xùn)練場(chǎng)景下最直接、最剛需的交付形態(tài)。虛時(shí)科技真正瞄準(zhǔn)的，是物理AI時(shí)代對(duì)三維空間數(shù)據(jù)的底層需求：持續(xù)生成足夠多樣、足夠可控、足夠可交互，并且能夠直接進(jìn)入訓(xùn)練管線的仿真空間。

他們之所以選擇將商業(yè)化的第一步落在具身智能上，原因也很明確。在物理AI賽道中，具身智能的數(shù)據(jù)需求更剛性、規(guī)?；臻g更大，也是檢驗(yàn)基座能力、加速模型迭代的最優(yōu)戰(zhàn)場(chǎng)。在這個(gè)過(guò)程中，每一份進(jìn)入真實(shí)訓(xùn)練流程的仿真數(shù)據(jù)，既是商業(yè)產(chǎn)出，也是模型能力的持續(xù)積累。

目前，行業(yè)已從“要不要用仿真數(shù)據(jù)”，進(jìn)入“如何定義、采購(gòu)和驗(yàn)收高質(zhì)量仿真數(shù)據(jù)”的新階段。圍繞可訓(xùn)練場(chǎng)景的類型、必要物理屬性、仿真平臺(tái)適配、任務(wù)包組織方式和商業(yè)化計(jì)費(fèi)方式，虛時(shí)科技已在與地瓜機(jī)器人及下游客戶的驗(yàn)證中形成了一套初步框架，并正通過(guò)AnySceneGen將其產(chǎn)品化、平臺(tái)化。

虛時(shí)科技產(chǎn)品流程圖

從生態(tài)位上看，虛時(shí)科技專注于補(bǔ)齊物理AI演進(jìn)過(guò)程中最上游、也最容易被低估的一環(huán)——可規(guī)?；傻姆抡婵臻g數(shù)據(jù)。

AnySceneGen的上線，標(biāo)志著這套能力已經(jīng)從技術(shù)驗(yàn)證進(jìn)入產(chǎn)業(yè)生態(tài)。對(duì)于具身智能而言，下一階段的競(jìng)爭(zhēng)不只在模型和本體，也在誰(shuí)能持續(xù)生產(chǎn)足夠多、足夠泛化、足夠可用的訓(xùn)練數(shù)據(jù)。虛時(shí)科技押注的，正是這個(gè)基礎(chǔ)設(shè)施級(jí)的大風(fēng)向。

（文中圖片來(lái)源：虛時(shí)科技，封面圖來(lái)源：AI生成）

聲明：包含AI生成內(nèi)容

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.