免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

地瓜機(jī)器人攜手虛時(shí)科技,補(bǔ)上具身智能的仿真數(shù)據(jù)“黑洞”|甲子光年

0
分享至



重構(gòu)仿真數(shù)據(jù)的生產(chǎn)方式。

作者|劉楊楠

編輯|栗子


5月12日,虛時(shí)科技(Intime AI)與地瓜機(jī)器人聯(lián)合開(kāi)發(fā)的首款仿真空間數(shù)據(jù)生成平臺(tái)——AnySceneGen正式發(fā)布。

這是一個(gè)面向具身智能訓(xùn)練的仿真空間生成平臺(tái)。用戶可以基于多模態(tài)輸入,快速生成對(duì)應(yīng)的三維仿真場(chǎng)景,場(chǎng)景中所有物體自帶完整的物理屬性,可直接導(dǎo)入Isaac Sim、MuJoCo等主流仿真平臺(tái),用于機(jī)器人訓(xùn)練、評(píng)測(cè)與數(shù)據(jù)采集。


AnySceneGen平臺(tái)產(chǎn)品界面

這場(chǎng)合作真正值得關(guān)注的,是它直指一個(gè)被反復(fù)提及,卻遲遲無(wú)解的行業(yè)難題。

過(guò)去兩年,具身智能對(duì)訓(xùn)練數(shù)據(jù)的需求進(jìn)入指數(shù)級(jí)增長(zhǎng)階段。仿真數(shù)據(jù)理論上可以突破真實(shí)采集的物理限制,通過(guò)算力并行無(wú)限擴(kuò)展,且邊際成本隨規(guī)模遞減。

但現(xiàn)實(shí)中,除了備受關(guān)注Sim2Real Gap問(wèn)題外,真正可用于仿真的空間環(huán)境(Sim-ready 3D scene)的供給方式還停留在手工作坊時(shí)代。建模師逐個(gè)制作資產(chǎn),手動(dòng)搭建場(chǎng)景,再逐一配置物理參數(shù)。這套流程的成本和效率,讓仿真數(shù)據(jù)規(guī)?;a(chǎn)的理論優(yōu)勢(shì)始終無(wú)法兌現(xiàn)。

虛時(shí)科技要做的,就是打破這個(gè)局面。

虛時(shí)科技成立于2024年下半年,是一家專注于打造物理AI時(shí)代數(shù)據(jù)基礎(chǔ)設(shè)施的初創(chuàng)公司,目前已獲得奇績(jī)創(chuàng)壇、宇跡科創(chuàng)的種子輪投資。

他們的切入點(diǎn)正是仿真空間規(guī)?;a(chǎn)的底層難題——用模型替代人工,重構(gòu)整個(gè)仿真數(shù)據(jù)的供給方式。

1.重構(gòu)仿真數(shù)據(jù)的生產(chǎn)方式

當(dāng)前,具身智能已經(jīng)全面進(jìn)入數(shù)據(jù)驅(qū)動(dòng)階段。

過(guò)去一年,國(guó)內(nèi)人形機(jī)器人公司密集融資,各家廠商的硬件能力快速迭代,Demo演示越來(lái)越流暢。但進(jìn)入真實(shí)場(chǎng)景后,機(jī)器人往往容易“翻車”。因?yàn)檎鎸?shí)環(huán)境千變?nèi)f化,光照、物體擺放角度、背景干擾、沒(méi)見(jiàn)過(guò)的新物體,任何一個(gè)變量超出訓(xùn)練分布,模型就可能崩潰。

要讓模型具備這種泛化能力,需要的是海量、多樣化、覆蓋長(zhǎng)尾場(chǎng)景的訓(xùn)練數(shù)據(jù)。

在具身智能可用的訓(xùn)練數(shù)據(jù)構(gòu)成中,真實(shí)遙操作數(shù)據(jù)是機(jī)器人理解物理世界最直接的基準(zhǔn),對(duì)于模型校準(zhǔn)不可或缺。

但它的局限性同樣顯而易見(jiàn)。

每一條有效數(shù)據(jù)背后,是工程師輪班、設(shè)備損耗和場(chǎng)地限制,人力和硬件成本高昂。同時(shí),危險(xiǎn)場(chǎng)景和長(zhǎng)尾場(chǎng)景天然難以覆蓋,并且無(wú)法適配強(qiáng)化學(xué)習(xí)、評(píng)測(cè)等環(huán)節(jié),采集到的數(shù)據(jù)涵蓋的物理信息也非常有限,可交互性較差。

更致命的是,這種方式的采集成本遵循線性增長(zhǎng)邏輯。數(shù)據(jù)量每增加一個(gè)數(shù)量級(jí),需要投入的人力和時(shí)間近乎等比例上升。這意味著真機(jī)數(shù)據(jù)更適合早期少數(shù)任務(wù)驗(yàn)證。一旦涉及規(guī)模化落地,這種方式的成本高不可及。

今年,雖然一些公司已經(jīng)定下了全年采集百萬(wàn)小時(shí)級(jí)數(shù)據(jù)集的目標(biāo),但對(duì)于打造通用機(jī)器人的終極遠(yuǎn)景,這個(gè)體量還遠(yuǎn)遠(yuǎn)不夠。

仿真數(shù)據(jù)也因此被推到臺(tái)前。它的優(yōu)勢(shì)很直觀,可通過(guò)并行算力規(guī)?;瘮U(kuò)展,場(chǎng)景變量更加可控,能批量生成真機(jī)難以獲取的因果維度訓(xùn)練樣本。

對(duì)此,學(xué)界和產(chǎn)業(yè)界已有代表性案例。今年4月,蘇度科技發(fā)布軟硬件全棧自研的機(jī)器人系統(tǒng)Sudo R1,采用世界模型與強(qiáng)化學(xué)習(xí)一體化設(shè)計(jì),在不使用任何真機(jī)數(shù)據(jù)的前提下,實(shí)現(xiàn)了關(guān)鍵任務(wù)近100%的Zero-shot成功率。

這個(gè)案例足以證明,仿真數(shù)據(jù)的價(jià)值上限,遠(yuǎn)未被觸達(dá)。

但一個(gè)容易被忽視的悖論是,仿真數(shù)據(jù)本應(yīng)突破真實(shí)數(shù)據(jù)采集的規(guī)?;款i,可在現(xiàn)有生產(chǎn)流程中,能夠用于閉環(huán)交互、實(shí)驗(yàn)和數(shù)據(jù)采集的仿真空間,仍主要依賴人工建模、人工布置和人工配置物理參數(shù),其生產(chǎn)方式尚未實(shí)現(xiàn)規(guī)?;?。

還原一下傳統(tǒng)仿真數(shù)據(jù)生產(chǎn)流程,就能看到問(wèn)題所在。

當(dāng)前,雖然有各種基于生成或者重建的技術(shù)路徑,但要么缺失空間智能,仍需依賴人工擺放;要么缺乏可交互能力。最終,行業(yè)常見(jiàn)做法仍是由建模師手工制作,調(diào)取或者生成多個(gè)3D資產(chǎn),再把資產(chǎn)逐個(gè)擺放成空間場(chǎng)景,導(dǎo)入Isaac Sim、MuJoCo等仿真器,最后手動(dòng)為每個(gè)物體配置材質(zhì)、質(zhì)量、摩擦系數(shù)等物理參數(shù)。

整個(gè)建模過(guò)程中,每一步都需要專業(yè)人員參與,且效率同樣呈線性增長(zhǎng)。一個(gè)有經(jīng)驗(yàn)的建模師一天只能搭出少量可用場(chǎng)景,如果要生成100個(gè)布局不同的廚房,時(shí)間成本幾乎是單個(gè)廚房的100倍。

如果企業(yè)沿用傳統(tǒng)人工建模方法,在超大規(guī)模需求下,邊際成本將急劇上升。如果仿真數(shù)據(jù)的生產(chǎn)方式不變,其在模型訓(xùn)練中的效率優(yōu)勢(shì)就永遠(yuǎn)停留在理論上。

這便是虛時(shí)科技正在撬動(dòng)的杠桿。

2.Code-to-Space:規(guī)?;┙o仿真數(shù)據(jù)的新范式

創(chuàng)業(yè)前,王德駪對(duì)技術(shù)方向已有充分的系統(tǒng)性思考。此前,在亞馬遜Alexa擔(dān)任大模型組技術(shù)負(fù)責(zé)人期間,王德駪曾負(fù)責(zé)LLM的開(kāi)發(fā)和部署,帶領(lǐng)數(shù)十人研發(fā)團(tuán)隊(duì),服務(wù)全球約6億用戶。


虛時(shí)科技CEO王德駪

過(guò)去幾年,AI領(lǐng)域的熱點(diǎn)仍聚焦在語(yǔ)言模型、圖像生成和多模態(tài)理解上,“空間智能”和“世界模型”尚未成為行業(yè)共識(shí)。但基于在大模型一線研發(fā)和產(chǎn)業(yè)落地中的經(jīng)驗(yàn),王德駪很早形成了一個(gè)方向性判斷。

在他看來(lái),今天的AI之所以能在文本、圖像等二維信息的理解與生成上逼近甚至超越人類,是因?yàn)榛ヂ?lián)網(wǎng)積累了海量的數(shù)字化語(yǔ)料和視覺(jué)數(shù)據(jù)。但人類智能從來(lái)不只是閱讀文字和觀看圖像的結(jié)果更關(guān)鍵的一部分能力,是在與物理世界進(jìn)行交互、感知、操控和反饋的閉環(huán)中塑造出來(lái)的。

這意味著,如果AI真的要邁向通用,它就不能永遠(yuǎn)停留在屏幕里處理符號(hào)。它必須走出二維信息的繭房,進(jìn)入三維的、有重力、有摩擦、有碰撞的物理世界,去理解空間、結(jié)構(gòu)、尺度、材質(zhì)和物理約束等更高維的信息。

而今天被行業(yè)反復(fù)討論的物理AI,本質(zhì)上也正是在回應(yīng)一個(gè)問(wèn)題——如何讓AI從理解數(shù)字世界,走向理解物理世界,并在物理世界中完成感知、交互和決策。

沿著這個(gè)方向推演,物理AI當(dāng)前最核心的落地場(chǎng)景,無(wú)疑是具身智能。王德駪明確判斷,仿真數(shù)據(jù)固然是當(dāng)前機(jī)器人訓(xùn)練中成本最低、產(chǎn)能最大的數(shù)據(jù)路線。但前提是,仿真數(shù)據(jù)的生產(chǎn)本身必須從傳統(tǒng)的人工主導(dǎo)轉(zhuǎn)向模型驅(qū)動(dòng)。

理論上,大模型是規(guī)模化生成這類數(shù)據(jù)的最佳候選。但受限于當(dāng)前語(yǔ)言和視覺(jué)模型的訓(xùn)練方式,模型并不具備理解和生成三維空間所需的“空間智能”。

此前,讓模型學(xué)習(xí)空間智能的一種思路,是通過(guò)“重建+表征學(xué)習(xí)”提高模型的空間理解能力,但這難以讓模型真正學(xué)習(xí)空間構(gòu)造的底層邏輯,因此也難以形成真正的空間智能。

是否能基于大語(yǔ)言模型的底層能力,走一條更符合空間智能形成機(jī)制的路徑?這正是王德駪技術(shù)構(gòu)想的起點(diǎn)。

我們?nèi)粘K幍拇罅靠臻g,本質(zhì)上都是由人類設(shè)計(jì)、建造和使用經(jīng)驗(yàn)共同塑造出來(lái)的“人造空間”,內(nèi)含一套可被拆解、抽象和復(fù)用的結(jié)構(gòu)化邏輯。

專業(yè)建模過(guò)程,則是這套空間構(gòu)造邏輯在數(shù)字世界中的顯性表達(dá)。一個(gè)建模人員會(huì)先理解空間的功能、尺度、結(jié)構(gòu)和關(guān)系,再逐步完成資產(chǎn)建模、布局組織、材質(zhì)處理和可用性校驗(yàn),不只是簡(jiǎn)單復(fù)刻空間的外觀。

在王德駪看來(lái),這本質(zhì)上就是在空間生成領(lǐng)域的一條“思維鏈(CoT)”。

語(yǔ)言模型已被驗(yàn)證能夠沿思維鏈學(xué)會(huì)深度推理,只要將人類構(gòu)造空間的思維過(guò)程解構(gòu)并重組,形成一套專屬于空間構(gòu)造的“CoT”,模型就能學(xué)會(huì)隱藏在人類建模背后的空間構(gòu)造邏輯,進(jìn)而讓模型涌現(xiàn)出真正的“空間智能”。

空間生成能力跑通后,下一個(gè)挑戰(zhàn)是,生成結(jié)果如何規(guī)?;度刖呱碇悄艿挠?xùn)練管線?

機(jī)器人需要在場(chǎng)景中進(jìn)行千萬(wàn)次試錯(cuò),每一次反饋都可能要求調(diào)整場(chǎng)景中的某個(gè)變量,而大模型的生成能力自帶隨機(jī)性,很難在這種高交互密度的訓(xùn)練管線中靈活應(yīng)變。

如何實(shí)現(xiàn)生成結(jié)果的高可控性?

虛時(shí)科技更進(jìn)一步,以代碼作為輸出,模型不直接輸出3D視覺(jué)結(jié)果,而是生成建模過(guò)程對(duì)應(yīng)的可執(zhí)行代碼,再將代碼編譯成最終的3D空間資產(chǎn)和場(chǎng)景——這是虛時(shí)科技最具突破性的創(chuàng)新。代碼本身可檢查、可修改、可約束、可迭代的特性,能夠天然適配具身訓(xùn)練對(duì)場(chǎng)景變量的精細(xì)控制要求。

最終,虛時(shí)科技形成了獨(dú)創(chuàng)的Code-to-Space技術(shù)方案以及自研空間智能模型,通過(guò)深度發(fā)掘空間感知層背后的空間結(jié)構(gòu)、尺度關(guān)系、功能邏輯、交互方式和物理約束等空間信息,并將其壓縮成可推理、可編輯、可執(zhí)行的結(jié)構(gòu)化表示,從而規(guī)?;筛哔|(zhì)量、高可控性的仿真空間。

這套技術(shù)方案的核心優(yōu)勢(shì)有三個(gè)層面:

第一,資產(chǎn)獨(dú)立可編輯。基于mesh的結(jié)構(gòu)化表達(dá),桌子是桌子,杯子是杯子,可以像搭積木一樣自由移動(dòng)、替換。而基于3D高斯?jié)姙R或NeRF等隱式表征路線生成的3D空間,所有資產(chǎn)和空間粘連在一起,作為一個(gè)整體模型存在,無(wú)法進(jìn)行分離、編輯和獨(dú)立控制。

第二,生成空間自帶物理屬性。模型通過(guò)數(shù)值化參數(shù)生成精準(zhǔn)材質(zhì),例如透明度、折射率、反光率、粗糙度、金屬度等。在此基礎(chǔ)上,模型中的生成式物理仿真模塊進(jìn)一步結(jié)合資產(chǎn)幾何、材質(zhì)和空間上下文,預(yù)測(cè)重量、摩擦系數(shù)、碰撞相關(guān)參數(shù)等物理屬性,并自動(dòng)寫(xiě)入U(xiǎn)SD等通用仿真文件格式。傳統(tǒng)仿真流程中需要人工手動(dòng)配置的環(huán)節(jié),被全面自動(dòng)化。

第三,可規(guī)?;夯?。傳統(tǒng)基于掃描重建的數(shù)字孿生技術(shù),本質(zhì)上只能還原已有世界。而Code-to-Space不僅能還原特定場(chǎng)景,還能批量生成布局不同但空間合理的場(chǎng)景變體。這恰好切中了具身預(yù)訓(xùn)練對(duì)場(chǎng)景多樣性的核心需求。

從更底層的視角看,Code-to-Space本質(zhì)是對(duì)仿真空間生產(chǎn)范式的變革。

傳統(tǒng)3D軟件的可視化界面,本質(zhì)上是面向建模師開(kāi)發(fā)的操作層。用戶在界面上的每一次操作,最終都需要通過(guò)底層代碼被執(zhí)行;而Code-to-Space是面向大模型、面向Agent開(kāi)發(fā)的空間生成方式,由模型直接生成底層代碼,并將其映射為可編輯、可交互、具備物理屬性的仿真空間。

技術(shù)路徑跑通后,公司開(kāi)始思考如何將這套方案推向產(chǎn)業(yè)。

這正是王云峰加入虛時(shí)科技出任COO的核心原因。王云峰的履歷橫跨互聯(lián)網(wǎng)和AI兩個(gè)時(shí)代,他是搜狗搜索的核心創(chuàng)始成員之一,曾與王小川等五位聯(lián)創(chuàng)共同打造搜狗搜索,擔(dān)任過(guò)搜索架構(gòu)負(fù)責(zé)人、阿里云高級(jí)專家。加入虛時(shí)科技前,王云峰曾任上市公司值得買(mǎi)科技CTO,并主導(dǎo)其AI應(yīng)用研究院的技術(shù)建設(shè)與應(yīng)用探索。


虛時(shí)科技COO王云峰

正因?yàn)橥暾?jīng)歷過(guò)搜索引擎、推薦系統(tǒng)、大語(yǔ)言模型三個(gè)技術(shù)周期,王云峰對(duì)數(shù)據(jù)基礎(chǔ)設(shè)施的價(jià)值有切身體會(huì)。這些技術(shù)的崛起,本質(zhì)上都建立在大規(guī)模、高質(zhì)量數(shù)據(jù)供給之上。物理AI要發(fā)展,回到最底層,同樣需要先解決“數(shù)據(jù)從哪里來(lái)”的問(wèn)題?!罢鎸?shí)世界數(shù)據(jù)太貴、太慢、太難覆蓋長(zhǎng)尾場(chǎng)景,仿真數(shù)據(jù)生產(chǎn)又過(guò)度依賴人工,這里面一定會(huì)出現(xiàn)新的平臺(tái)型公司?!蓖踉品灞硎?。

因此,他加入虛時(shí)科技,正是要將Code-to-Space這條技術(shù)路徑,轉(zhuǎn)化為物理AI時(shí)代的數(shù)據(jù)生產(chǎn)基礎(chǔ)設(shè)施,推向商業(yè)市場(chǎng)。

目前,團(tuán)隊(duì)分工明確:王德駪負(fù)責(zé)整體方向、核心技術(shù)研發(fā)與模型路線判斷;王云峰負(fù)責(zé)商務(wù)、運(yùn)營(yíng)與外部合作的整體推進(jìn)。一個(gè)主攻技術(shù)深度,一個(gè)主攻產(chǎn)業(yè)落地,形成互補(bǔ)。

3.聯(lián)手地瓜,完成關(guān)鍵下游驗(yàn)證

2025年底,地瓜機(jī)器人關(guān)注到了虛時(shí)科技的技術(shù)與下游適配性。

整體來(lái)看,地瓜機(jī)器人有三大核心業(yè)務(wù)板塊:芯片(硬件底座)、機(jī)器人平臺(tái)能力(算法)、開(kāi)發(fā)者生態(tài)(數(shù)據(jù)、工具)。這一布局某種程度上對(duì)標(biāo)了英偉達(dá)“芯片+Omniverse+Newton生態(tài)”的架構(gòu)。

在這套架構(gòu)中,數(shù)據(jù)是連接硬件底座與算法能力的關(guān)鍵一環(huán),直接決定了開(kāi)發(fā)者生態(tài)的完整性和可用性。地瓜機(jī)器人也一直在尋找能夠在這個(gè)環(huán)節(jié)進(jìn)行更深戰(zhàn)略布局的機(jī)會(huì)。

對(duì)地瓜機(jī)器人而言,仿真數(shù)據(jù)一直是內(nèi)部算法研發(fā)的重要基礎(chǔ),也是完善下游開(kāi)發(fā)者生態(tài)、服務(wù)下游客戶的關(guān)鍵能力之一。問(wèn)題在于,能夠規(guī)?;┙o高質(zhì)量仿真數(shù)據(jù)的方案長(zhǎng)期缺位。正是在這個(gè)背景下,虛時(shí)科技進(jìn)入了地瓜機(jī)器人的視野。

地瓜機(jī)器人具身智能算法負(fù)責(zé)人何泳澔看重的,除了單個(gè)仿真空間的生成質(zhì)量,還有仿真空間生成的多樣性和泛化能力。

在他看來(lái),具身智能訓(xùn)練需要兩類數(shù)據(jù),一是少量高精度場(chǎng)景,用于精細(xì)化調(diào)試;二是大規(guī)模、低成本、覆蓋不同空間尺度、物體組合、布局關(guān)系、任務(wù)條件和長(zhǎng)尾情況的泛化數(shù)據(jù),用于預(yù)訓(xùn)練階段的模型泛化能力建設(shè)。

許多廠商能夠憑借前者打造出精美的機(jī)器人Demo,但后者的供給長(zhǎng)期嚴(yán)重匱乏,這也正是機(jī)器人在真實(shí)場(chǎng)景中落地困難重重的根源所在。

他進(jìn)一步指出,具身模型的訓(xùn)練,尤其是預(yù)訓(xùn)練階段,數(shù)據(jù)的多樣性遠(yuǎn)比重建精度更重要。而多數(shù)仿真數(shù)據(jù)生成方案始終無(wú)法同時(shí)滿足“可生成、可編輯、可仿真、可規(guī)模化、可泛化”這五個(gè)條件,可這恰恰是仿真數(shù)據(jù)真正大規(guī)模進(jìn)入訓(xùn)練管線的硬性門(mén)檻。

雙方接觸后,地瓜發(fā)現(xiàn),虛時(shí)科技的Code-to-Space路徑在這五個(gè)關(guān)鍵環(huán)節(jié)上形成了完整閉環(huán)?!皬奈覀兡壳敖佑|和驗(yàn)證過(guò)的技術(shù)路徑來(lái)看,虛時(shí)科技的Code-to-Space是目前少數(shù),甚至可以說(shuō)是唯一真正能夠同時(shí)兼顧高質(zhì)量空間生成、物理屬性生成、可編輯性和規(guī)?;慨a(chǎn)的仿真空間生成方案?!焙斡緷槐硎?。


3D仿真空間生成效果圖

基于這一判斷,雙方從數(shù)據(jù)驗(yàn)證走向平臺(tái)共建,決定聯(lián)合開(kāi)發(fā)3D仿真空間生成平臺(tái)。

當(dāng)時(shí),虛時(shí)科技剛完成Code-to-Space從0到1的技術(shù)驗(yàn)證,正處于從技術(shù)走向市場(chǎng)的關(guān)鍵階段。對(duì)虛時(shí)科技而言,相比將數(shù)據(jù)賣(mài)給單一公司,更理想的模式是確立規(guī)模化生產(chǎn)仿真數(shù)據(jù)的技術(shù)標(biāo)桿,占據(jù)更普適的生態(tài)位入口,將數(shù)據(jù)以平臺(tái)化方式持續(xù)供給更多下游企業(yè)。

達(dá)成共識(shí)后,雙方開(kāi)始了為期三個(gè)月的技術(shù)驗(yàn)證。地瓜機(jī)器人的算法團(tuán)隊(duì)對(duì)生成質(zhì)量、流程穩(wěn)定性、物理屬性可用性和格式兼容性進(jìn)行了反復(fù)測(cè)試。

今年3月,雙方簽訂戰(zhàn)略合作協(xié)議,正式啟動(dòng)平臺(tái)開(kāi)發(fā)。

合作過(guò)程中,雙方分工明確,形成優(yōu)勢(shì)互補(bǔ)。地瓜主要提供具身算法、工具鏈和開(kāi)發(fā)平臺(tái)能力;虛時(shí)科技主要提供仿真空間生成模型,規(guī)?;勺詭锢韺傩缘姆抡鏀?shù)據(jù)。

5月12日,AnySceneGen Beta版本正式上線。

AnySceneGen的核心目標(biāo),是為具身智能仿真訓(xùn)練批量化生成可閉環(huán)交互的仿真空間。用戶可基于多模態(tài)輸入快速生成不同類型的仿真空間,結(jié)合自身訓(xùn)練需求采集合成數(shù)據(jù)并進(jìn)行模型訓(xùn)練。

在技術(shù)架構(gòu)上,AnySceneGen平臺(tái)采用基于mesh的結(jié)構(gòu)化輸出方案,相較于NeRF、3DGS等技術(shù)路徑,更適用于機(jī)器人仿真訓(xùn)練、物理交互與可執(zhí)行任務(wù)建模。

同時(shí),AnySceneGen生成的場(chǎng)景具備高度可控和可編輯能力。開(kāi)發(fā)者可根據(jù)訓(xùn)練需求,靈活調(diào)整空間布局、物體屬性、交互邏輯、材質(zhì)風(fēng)格以及任務(wù)約束,快速構(gòu)造具備多樣性與泛化性的仿真訓(xùn)練環(huán)境。

此外,平臺(tái)生成的空間不僅具備高質(zhì)量視覺(jué)屬性,也在生成過(guò)程中自動(dòng)生成并寫(xiě)入碰撞體、物理材質(zhì)、尺度關(guān)系、運(yùn)動(dòng)約束等物理屬性信息,可進(jìn)一步提升機(jī)器人在仿真環(huán)境中的交互真實(shí)性與訓(xùn)練穩(wěn)定性,為后續(xù)Sim2Real泛化提供更有效的數(shù)據(jù)基礎(chǔ)。

目前,平臺(tái)已經(jīng)深度集成虛時(shí)科技InteriorGen與地瓜機(jī)器人的TabletopGen能力,可生成桌面級(jí)與室內(nèi)級(jí)仿真空間。

基于AnySceneGen,地瓜機(jī)器人的具身團(tuán)隊(duì)也已開(kāi)始生成兩類仿真數(shù)據(jù):一類是Loco-manipulation,涉及硬件本體在仿真場(chǎng)景中的導(dǎo)航和操作數(shù)據(jù);另一類是空間感知,涉及多目異構(gòu)相機(jī)在空間中的深度或點(diǎn)云真值。

截至目前,前者已經(jīng)生成超過(guò)100萬(wàn)episodes,后者已經(jīng)生產(chǎn)超過(guò)1000萬(wàn)幀。

AnySceneGen平臺(tái)生成的仿真空間

接下來(lái),平臺(tái)會(huì)分階段推進(jìn)場(chǎng)景覆蓋能力——從桌面級(jí)場(chǎng)景和家庭空間起步,逐步延伸至辦公場(chǎng)所、工廠、超市、商業(yè)區(qū)等室內(nèi)場(chǎng)景?,F(xiàn)階段,平臺(tái)重點(diǎn)聚焦機(jī)器人操作任務(wù),后續(xù)將進(jìn)一步支持導(dǎo)航與操作結(jié)合的復(fù)合任務(wù),為下游開(kāi)發(fā)者提供更豐富的訓(xùn)練場(chǎng)景支撐。


虛時(shí)科技仿真空間生成案例圖

值得注意的是,AnySceneGen核心交付的是一套按需生成、持續(xù)供給的仿真數(shù)據(jù)生成能力。AnySceneGen的定位,更像是具身智能訓(xùn)練體系中的上游數(shù)據(jù)生成平臺(tái)。

客觀來(lái)看,這是一次典型的雙贏。

地瓜機(jī)器人增強(qiáng)了自身開(kāi)發(fā)者生態(tài)中數(shù)據(jù)供給的環(huán)節(jié),進(jìn)一步完善了“芯片+算法+開(kāi)發(fā)者生態(tài)”的全鏈路布局。

虛時(shí)科技則在完成技術(shù)自證后,獲得了一份來(lái)自頭部生態(tài)玩家的關(guān)鍵產(chǎn)業(yè)認(rèn)可。這并非偶然,而是其技術(shù)路線、生態(tài)位選擇和下游驗(yàn)證積累的一次集中兌現(xiàn)。

4.占據(jù)物理AI的基礎(chǔ)設(shè)施入口

AnySceneGen上線,是虛時(shí)科技的商業(yè)化起點(diǎn),但遠(yuǎn)不是終點(diǎn)。

當(dāng)前,具身智能訓(xùn)練的不同階段對(duì)數(shù)據(jù)的需求正在分化。預(yù)訓(xùn)練階段需要足夠多樣化的場(chǎng)景數(shù)據(jù)來(lái)提升泛化能力,這是仿真數(shù)據(jù)優(yōu)勢(shì)最明顯的環(huán)節(jié);后訓(xùn)練或微調(diào)階段則需要可控變量、長(zhǎng)尾場(chǎng)景和失敗案例來(lái)進(jìn)行系統(tǒng)評(píng)測(cè)和提升,仿真數(shù)據(jù)同樣是有力補(bǔ)充。

長(zhǎng)期來(lái)看,下游需求的細(xì)化將一步步倒逼上游數(shù)據(jù)供給體系加速產(chǎn)業(yè)分工。

「甲子光年」梳理發(fā)現(xiàn),具身智能仿真訓(xùn)練數(shù)據(jù)的供給體系正在加速分層,大致可以劃分為三層。

最上游是仿真空間生成,負(fù)責(zé)按訓(xùn)練需求規(guī)?;a(chǎn)出帶物理屬性的3D場(chǎng)景,直接決定數(shù)據(jù)供給的產(chǎn)能上限;中間層是仿真器,如Isaac Sim、MuJoCo等,承擔(dān)物理計(jì)算與傳感器渲染任務(wù),目前這一層格局已相對(duì)成熟;最下游是具身訓(xùn)練,由機(jī)器人廠商和算法團(tuán)隊(duì)基于任務(wù)需求,將仿真數(shù)據(jù)導(dǎo)入訓(xùn)練管線。

過(guò)去,這三層之間的協(xié)作高度耦合,仿真場(chǎng)景嚴(yán)重依賴人工定制,生產(chǎn)效率低下,迫使許多下游廠商不得不自建數(shù)據(jù)團(tuán)隊(duì),重復(fù)投入?yún)s難以規(guī)模化。

而隨著仿真數(shù)據(jù)的戰(zhàn)略價(jià)值被行業(yè)廣泛認(rèn)可,三層之間的專業(yè)化分工正在加速,尤其是上游仿真空間生成環(huán)節(jié),正在成為一個(gè)獨(dú)立的、平臺(tái)化的新機(jī)會(huì)。

虛時(shí)科技選擇切入的,正是這一環(huán)節(jié)。

公司基于Code-to-Space路徑自研的空間智能模型,將傳統(tǒng)人工仿真數(shù)據(jù)生產(chǎn)流程轉(zhuǎn)化為模型驅(qū)動(dòng)的平臺(tái)化供給能力,規(guī)?;勺銐蚍夯?、具備物理屬性、可編輯、可交互的3D仿真場(chǎng)景。

這也決定了,虛時(shí)科技與市面上一些仿真數(shù)據(jù)供應(yīng)商有本質(zhì)區(qū)別。

多數(shù)供應(yīng)商的核心模式,是圍繞具身智能的具體任務(wù),組織人力或半自動(dòng)化地生產(chǎn)仿真數(shù)據(jù),本質(zhì)上解決的是“交付數(shù)據(jù)”的問(wèn)題。而虛時(shí)科技的核心優(yōu)勢(shì),是完成了從“人工交付數(shù)據(jù)”到“模型生成空間”的關(guān)鍵跨越,形成了一套可規(guī)?;煞抡婵臻g的底層模型能力。

這意味著,仿真數(shù)據(jù)并非這套模型能力的全部,而是其在具身智能訓(xùn)練場(chǎng)景下最直接、最剛需的交付形態(tài)。虛時(shí)科技真正瞄準(zhǔn)的,是物理AI時(shí)代對(duì)三維空間數(shù)據(jù)的底層需求:持續(xù)生成足夠多樣、足夠可控、足夠可交互,并且能夠直接進(jìn)入訓(xùn)練管線的仿真空間。

他們之所以選擇將商業(yè)化的第一步落在具身智能上,原因也很明確。在物理AI賽道中,具身智能的數(shù)據(jù)需求更剛性、規(guī)?;臻g更大,也是檢驗(yàn)基座能力、加速模型迭代的最優(yōu)戰(zhàn)場(chǎng)。在這個(gè)過(guò)程中,每一份進(jìn)入真實(shí)訓(xùn)練流程的仿真數(shù)據(jù),既是商業(yè)產(chǎn)出,也是模型能力的持續(xù)積累。

目前,行業(yè)已從“要不要用仿真數(shù)據(jù)”,進(jìn)入“如何定義、采購(gòu)和驗(yàn)收高質(zhì)量仿真數(shù)據(jù)”的新階段。圍繞可訓(xùn)練場(chǎng)景的類型、必要物理屬性、仿真平臺(tái)適配、任務(wù)包組織方式和商業(yè)化計(jì)費(fèi)方式,虛時(shí)科技已在與地瓜機(jī)器人及下游客戶的驗(yàn)證中形成了一套初步框架,并正通過(guò)AnySceneGen將其產(chǎn)品化、平臺(tái)化。


虛時(shí)科技產(chǎn)品流程圖

從生態(tài)位上看,虛時(shí)科技專注于補(bǔ)齊物理AI演進(jìn)過(guò)程中最上游、也最容易被低估的一環(huán)——可規(guī)?;傻姆抡婵臻g數(shù)據(jù)。

AnySceneGen的上線,標(biāo)志著這套能力已經(jīng)從技術(shù)驗(yàn)證進(jìn)入產(chǎn)業(yè)生態(tài)。對(duì)于具身智能而言,下一階段的競(jìng)爭(zhēng)不只在模型和本體,也在誰(shuí)能持續(xù)生產(chǎn)足夠多、足夠泛化、足夠可用的訓(xùn)練數(shù)據(jù)。虛時(shí)科技押注的,正是這個(gè)基礎(chǔ)設(shè)施級(jí)的大風(fēng)向。

(文中圖片來(lái)源:虛時(shí)科技,封面圖來(lái)源:AI生成)



聲明:包含AI生成內(nèi)容

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
演員必須用原名了!楊紫白鹿還好,王星越笑噴:這誰(shuí)找得到

演員必須用原名了!楊紫白鹿還好,王星越笑噴:這誰(shuí)找得到

吃瓜蒙主
2026-06-19 00:30:03
難怪不興百褶裙了!滿大街都是“?奶奶裙”,時(shí)髦不顯臃腫,洋氣

難怪不興百褶裙了!滿大街都是“?奶奶裙”,時(shí)髦不顯臃腫,洋氣

時(shí)尚穿搭生活館
2026-06-18 23:10:33
11倍大牛股跌停,兩個(gè)月股價(jià)大跌56%,公司最新回應(yīng)

11倍大牛股跌停,兩個(gè)月股價(jià)大跌56%,公司最新回應(yīng)

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-06-18 20:22:19
若海峽對(duì)岸發(fā)放「投誠(chéng)食物」給大陸14億人,會(huì)產(chǎn)生什么影響嗎?

若海峽對(duì)岸發(fā)放「投誠(chéng)食物」給大陸14億人,會(huì)產(chǎn)生什么影響嗎?

龍牙的一座山
2026-06-15 09:09:03
柬埔寨電詐最大黑手竟然是副總理?

柬埔寨電詐最大黑手竟然是副總理?

鳳眼論
2026-06-18 18:45:10
斯基拉:皇馬與恩佐原則上達(dá)成協(xié)議,合同至2032年

斯基拉:皇馬與恩佐原則上達(dá)成協(xié)議,合同至2032年

懂球帝
2026-06-18 14:43:15
醒醒吧!就算臺(tái)灣愿意和平統(tǒng)一,臺(tái)灣也不可能同意解放軍在臺(tái)駐軍

醒醒吧!就算臺(tái)灣愿意和平統(tǒng)一,臺(tái)灣也不可能同意解放軍在臺(tái)駐軍

阿曇你好
2026-05-22 18:33:43
中國(guó)女排3-2逆轉(zhuǎn)德國(guó)! 沒(méi)想到日媒賽后這樣報(bào)道 還用四個(gè)字定義我們

中國(guó)女排3-2逆轉(zhuǎn)德國(guó)! 沒(méi)想到日媒賽后這樣報(bào)道 還用四個(gè)字定義我們

銜春信
2026-06-18 02:43:57
拒絕4897萬(wàn)選項(xiàng)!曝特雷?楊計(jì)劃成為自由球員 多隊(duì)有意引進(jìn)他

拒絕4897萬(wàn)選項(xiàng)!曝特雷?楊計(jì)劃成為自由球員 多隊(duì)有意引進(jìn)他

羅說(shuō)NBA
2026-06-18 09:58:32
藏不住了,“足球小將”父親公開(kāi)發(fā)聲,揭開(kāi)董路私下最真實(shí)的一面

藏不住了,“足球小將”父親公開(kāi)發(fā)聲,揭開(kāi)董路私下最真實(shí)的一面

深析古今
2026-06-18 09:43:36
《給阿嬤的情書(shū)》香港首映火爆 超200場(chǎng)排片多場(chǎng)滿座

《給阿嬤的情書(shū)》香港首映火爆 超200場(chǎng)排片多場(chǎng)滿座

環(huán)球網(wǎng)資訊
2026-06-18 23:25:23
不管你信不信:老人臨終前誰(shuí)在身邊、誰(shuí)不在身邊,冥冥中皆有安排

不管你信不信:老人臨終前誰(shuí)在身邊、誰(shuí)不在身邊,冥冥中皆有安排

荷蘭豆愛(ài)健康
2026-05-10 20:06:39
G7沒(méi)有發(fā)布聯(lián)合公報(bào):德法不愿為日本得罪中國(guó),一個(gè)時(shí)代結(jié)束了

G7沒(méi)有發(fā)布聯(lián)合公報(bào):德法不愿為日本得罪中國(guó),一個(gè)時(shí)代結(jié)束了

三石記
2026-06-18 07:58:06
NBA歷史最佳陣容出爐:杜蘭特3陣,庫(kù)里科比僅2陣,1陣無(wú)可替代

NBA歷史最佳陣容出爐:杜蘭特3陣,庫(kù)里科比僅2陣,1陣無(wú)可替代

林子說(shuō)事
2026-06-18 01:13:59
皇馬第三簽正式官宣!穆帥認(rèn)可后防統(tǒng)帥,姆巴佩親自說(shuō)服加入

皇馬第三簽正式官宣!穆帥認(rèn)可后防統(tǒng)帥,姆巴佩親自說(shuō)服加入

林子說(shuō)事
2026-06-18 19:00:25
太諷刺!世界杯期間,以色列還關(guān)著巴勒斯坦女足國(guó)腳、美國(guó)女生

太諷刺!世界杯期間,以色列還關(guān)著巴勒斯坦女足國(guó)腳、美國(guó)女生

觀察者網(wǎng)
2026-06-18 10:55:10
中老年人同居一定要記?。簺](méi)有生理上的需求,就不要再去搭伙了?

中老年人同居一定要記?。簺](méi)有生理上的需求,就不要再去搭伙了?

游戲收藏指南
2026-06-05 17:44:29
醫(yī)生發(fā)現(xiàn):能吃能喝的老人,基本在70歲,就已經(jīng)不做這6件事了!

醫(yī)生發(fā)現(xiàn):能吃能喝的老人,基本在70歲,就已經(jīng)不做這6件事了!

醫(yī)學(xué)原創(chuàng)故事會(huì)
2026-06-16 18:47:09
上海市委書(shū)記陳吉寧:平庸與卓越的差別(強(qiáng)烈推薦)

上海市委書(shū)記陳吉寧:平庸與卓越的差別(強(qiáng)烈推薦)

新浪財(cái)經(jīng)
2026-06-18 07:10:25
贏球也被噴!英格蘭世界杯頭號(hào)臥底!球迷集體喊他滾出首發(fā)

贏球也被噴!英格蘭世界杯頭號(hào)臥底!球迷集體喊他滾出首發(fā)

瀾歸序
2026-06-18 06:41:12
2026-06-19 05:16:49
甲子光年
甲子光年
中國(guó)科技產(chǎn)業(yè)化前沿智庫(kù)
3485文章數(shù) 9274關(guān)注度
往期回顧 全部

科技要聞

庫(kù)克承認(rèn)扛不住了,蘋(píng)果漲價(jià)“不可避免”

頭條要聞

159瓶茅臺(tái)被扣3年后多瓶失蹤 警方:酒仍處于扣押時(shí)狀態(tài)

頭條要聞

159瓶茅臺(tái)被扣3年后多瓶失蹤 警方:酒仍處于扣押時(shí)狀態(tài)

體育要聞

英格蘭不再九子奪嫡,凱恩才是唯一真神

娛樂(lè)要聞

39歲梅西不愧是人生贏家!

財(cái)經(jīng)要聞

博??礗PO,賺錢(qián)業(yè)務(wù)與資本敘事是兩門(mén)生意

汽車要聞

驚出冷汗!重慶實(shí)測(cè)奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

房產(chǎn)
家居
健康
藝術(shù)
手機(jī)

房產(chǎn)要聞

商業(yè)清零式退潮,大量住宅登場(chǎng)!三亞又要大規(guī)模調(diào)規(guī)!

家居要聞

綠意盎然 自然之境

吃粽子的3條保胃法則,消化科醫(yī)生推薦

藝術(shù)要聞

臺(tái)北東區(qū)新門(mén)戶!南港雙星,像一道“城市裂痕”

手機(jī)要聞

iOS 27「查找」App升級(jí):支持隱藏共享位置與自定義時(shí)長(zhǎng)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版