免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

比英偉達(dá)早,大曉Kairos原生一體化世界模型定義物理AI新路線

0
分享至




機(jī)器之心發(fā)布

在世界模型這條賽道上,很少有時(shí)刻能像現(xiàn)在這樣耐人尋味。

時(shí)間撥回 2025 年 12 月,大曉機(jī)器人正式發(fā)布 Kairos "多模態(tài)理解 — 生成 — 預(yù)測" 原生一體化架構(gòu);今年 3 月,這套架構(gòu)完成了端側(cè)部署和驗(yàn)證。而此后,英偉達(dá)最新發(fā)布的 Cosmos 3.0,竟也采用了同源架構(gòu)。

一家中國具身智能公司,比行業(yè)巨頭提前押中了同一條技術(shù)路線。這背后,是 Kairos 開悟世界模型早已新創(chuàng)的原生一體化技術(shù)體系。

而就在近日,這套體系交出了一份足夠硬的成績單 —— 大曉機(jī)器人開悟世界模型(Kairos)在 RoboTwin 2.0、LIBERO-Plus、WorldModelBench、DreamGen Bench 四大全球權(quán)威具身智能基準(zhǔn)上全面登頂。這份領(lǐng)跑成績的背后,是 Kairos 3.0 對世界模型技術(shù)路線的底層范式革新。



如今,大曉機(jī)器人正式發(fā)布開悟世界模型技術(shù)報(bào)告,詳細(xì)闡述 Kairos 開悟世界模型以原生一體化設(shè)計(jì)、面向具身智能訓(xùn)練為核心哲學(xué),從架構(gòu)底層為物理 AI 原生打造,首次實(shí)現(xiàn) "多模態(tài)理解 — 生成 — 預(yù)測" 原生一體化架構(gòu)、跨具身漸進(jìn)式訓(xùn)練體系及 "以人為中心" 的數(shù)據(jù)金字塔,以及端側(cè)可部署的能力,將世界模型從 "世界生成器" 升級為 "理解世界、生成世界、與世界交互" 的全新模型,實(shí)現(xiàn)了與行業(yè)普遍 "通用視頻生成模型 + 具身場景續(xù)訓(xùn)微調(diào)" 截然不同的路徑。

技術(shù)報(bào)告鏈接:

  • https://arxiv.org/abs/2606.16533
  • https://huggingface.co/papers/2606.16533

要理解 Kairos 開悟世界模型為何能提前一步,得先看清整個(gè)行業(yè)卡在了哪里。

三大流派各有所長,卻撞上同一堵墻

當(dāng)具身智能從概念走向產(chǎn)業(yè)落地,世界模型從單純的視頻生成演示品,轉(zhuǎn)向支撐機(jī)器人真實(shí)運(yùn)行的核心基礎(chǔ)。當(dāng)前全球世界模型研究已形成三大主流技術(shù)流派,沿著不同路徑向物理 AI 基礎(chǔ)設(shè)施方向演進(jìn)。

  • 第一類是生成式像素級渲染流派,以英偉達(dá) Cosmos 為代表,核心是在像素空間直接合成高保真、時(shí)序連貫的未來視覺畫面,主打視頻生成與數(shù)字孿生能力,視覺逼真度突出,但計(jì)算開銷較高,天然帶有內(nèi)容生成屬性。
  • 第二類是交互式環(huán)境建模范式,代表包括 DeepMind Genie 3、Dreamer 系列,側(cè)重構(gòu)建可探索、可交互的持久仿真環(huán)境,智能體可通過 "想象" 遞歸優(yōu)化長時(shí)程行為,作為內(nèi)部模擬器支撐自進(jìn)化學(xué)習(xí)。
  • 第三類是預(yù)測式潛表征學(xué)習(xí)流派,以 Meta JEPA 系列為典型,不做像素級渲染,而是在抽象隱空間中學(xué)習(xí)具備物理意義的預(yù)測結(jié)構(gòu),天然適配零樣本規(guī)劃、機(jī)器人控制等下游決策任務(wù),計(jì)算效率更優(yōu)。

三類路徑各有側(cè)重,但普遍面臨學(xué)習(xí)碎片化、長時(shí)程狀態(tài)漂移、具身錨定不足等共性瓶頸。為此,大曉機(jī)器人以原生范式破局,以技術(shù)效率取勝,Kairos 開悟世界模型正在重新定義世界模型的技術(shù)坐標(biāo)系。下面從架構(gòu)、訓(xùn)練、部署三個(gè)層面,拆解 Kairos 究竟做對了什么。

原生一體化架構(gòu),打造具身的「最強(qiáng)大腦」

Kairos 開悟世界模型首創(chuàng)的 "多模態(tài)理解 — 生成 — 預(yù)測" 原生一體化架構(gòu),讓世界模型第一次在底層實(shí)現(xiàn)了 "能認(rèn)知、會推演、可執(zhí)行" 的完整能力閉環(huán),徹底跳出了傳統(tǒng)方案 "生成強(qiáng)、控制弱" 的能力偏科。

在此之前,行業(yè)主流世界模型普遍脫胎于通用視頻生成技術(shù)棧,走 "通用生成底座 + 外掛控制模塊" 的拼接路線。視頻生成模塊專注視覺渲染,動作控制模塊單獨(dú)訓(xùn)練輸出軌跡,兩套系統(tǒng)各自獨(dú)立、表征體系完全割裂。這種組裝式設(shè)計(jì)帶來三大長期難解的行業(yè)頑疾。

  • 一是表征錯位,視覺語義與機(jī)器人動作空間無法原生對齊,直接導(dǎo)致動作執(zhí)行與環(huán)境動態(tài)不同步、物理交互細(xì)節(jié)失真;
  • 二是誤差累積,"先生成畫面、再提取動作" 的兩級流水線,每一步傳遞都在引入偏差,長時(shí)程復(fù)雜任務(wù)下狀態(tài)漂移問題尤為突出;
  • 三是定位局限,模型始終停留在 "內(nèi)容生成工具" 的定位,無法成為支撐機(jī)器人自主決策的智能底座,難以支撐真正的閉環(huán)自進(jìn)化。



開悟世界模型 Kairos 架構(gòu)圖

Kairos 開悟世界模型徹底摒棄了拼接式設(shè)計(jì)思路,以單一混合 Transformer(MoT)為統(tǒng)一骨干網(wǎng)絡(luò),將世界理解、世界生成、世界預(yù)測三大模塊原生融合進(jìn)同一套技術(shù)棧。三者并非簡單的功能堆疊,而是共享同一套底層世界狀態(tài)表征,由混合線性時(shí)序記憶機(jī)制統(tǒng)一維護(hù)全局狀態(tài)一致性,從根源上消解了模塊拼接帶來的內(nèi)生矛盾。

具體來看,世界理解模塊作為全系統(tǒng)的認(rèn)知基底,從異構(gòu)多源數(shù)據(jù)中提煉物理規(guī)律、因果邏輯與任務(wù)語義,為全鏈路輸出提供精準(zhǔn)的語義錨點(diǎn);世界生成模塊承接認(rèn)知結(jié)果,結(jié)合多模態(tài)指令推演生成物理自洽的環(huán)境動態(tài),核心服務(wù)于策略推演而非單純視覺展示;世界預(yù)測模塊與生成模塊采用同構(gòu)設(shè)計(jì)、聯(lián)合訓(xùn)練,可直接輸出可落地執(zhí)行的機(jī)器人動作軌跡,推理階段還可獨(dú)立啟用純動作預(yù)測模式,跳過視頻生成環(huán)節(jié)直接輸出控制指令,兼顧精度與部署效率。

Kairos 開悟世界模型原生一體化架構(gòu)不僅解決了長期困擾行業(yè)的表征錯位與誤差累積難題,更重新定義了世界模型的核心價(jià)值,它不再是輔助性的生成工具,而是具備完整認(rèn)知閉環(huán)的物理智能內(nèi)生大腦。

首創(chuàng)具身原生預(yù)訓(xùn)練范式,讓世界模型從「懂物理」到「會操作」

架構(gòu)層面的原生一體化能力,根源上來自 Kairos 開悟世界模型首創(chuàng)的物理 AI 原生預(yù)訓(xùn)練范式。正是這套分層遞進(jìn)的訓(xùn)練體系,讓 Kairos 開悟世界模型實(shí)現(xiàn)了跨場景、跨具身的強(qiáng)泛化能力,在四大基準(zhǔn)測試中持續(xù)超越全球主流世界模型廠商。

在傳統(tǒng)技術(shù)路線中,世界模型普遍遵循 "通用視頻生成模型 + 機(jī)器人數(shù)據(jù)下游續(xù)訓(xùn)" 的路徑,背后是數(shù)據(jù)來源的天然割裂困境?;ヂ?lián)網(wǎng)開放視頻規(guī)模巨大但缺乏動作錨定與任務(wù)意圖,僅能提供表層視覺規(guī)律;人類行為數(shù)據(jù)蘊(yùn)含任務(wù)邏輯與交互模式,卻無法直接對齊機(jī)器人控制空間;機(jī)器人交互數(shù)據(jù)與具身控制最相關(guān),卻采集成本高、場景覆蓋窄,難以規(guī)?;??;旌嫌?xùn)練易造成信號沖突,分步微調(diào)又會導(dǎo)致知識斷層,最終模型往往陷入 "懂物理不會操作、會操作難泛化" 的兩難。

Kairos 開悟世界模型徹底摒棄這種 "后補(bǔ)式" 微調(diào)思路,提出跨具身數(shù)據(jù)課程(Cross-Embodiment Data Curriculum,CEDC),將異構(gòu)數(shù)據(jù)組織為三級漸進(jìn)式訓(xùn)練體系,從訓(xùn)練源頭原生注入物理智能。

第一階段為物理預(yù)訓(xùn)練,依托百萬小時(shí)級開放世界視頻,構(gòu)成物理認(rèn)知的規(guī)模根基。Kairos 開悟世界模型采用的數(shù)據(jù)覆蓋人類、機(jī)器人、通用場景、物理現(xiàn)象四大核心領(lǐng)域,通過層級分類體系實(shí)現(xiàn)千級細(xì)粒度場景覆蓋。這一層數(shù)據(jù)量級最大、覆蓋最廣,核心價(jià)值是為模型注入重力、碰撞、物體恒存、流體力學(xué)等通用物理規(guī)律,構(gòu)建底層世界常識,對應(yīng)物理預(yù)訓(xùn)練階段的能力目標(biāo)。

第二階段則是 "以人為中心" 的 ACE 數(shù)據(jù)范式,通過十萬小時(shí)級人類行為數(shù)據(jù),承載任務(wù)語義的過渡銜接。針對機(jī)器人操作場景數(shù)據(jù)稀缺的行業(yè)痛點(diǎn),團(tuán)隊(duì)收集了大量以人為中心的高精度人類操作數(shù)據(jù),并配套長時(shí)程任務(wù)思維鏈增強(qiáng),重點(diǎn)覆蓋工具使用、日常家務(wù)等結(jié)構(gòu)化任務(wù)場景,完整保留人類完成任務(wù)的視角邏輯、動作序列與隱含意圖,承上啟下打通物理認(rèn)知與動作控制的語義斷層,完成從 "被動觀察" 到 "主動理解" 的能力過渡。

第三階段為狀態(tài)與動作聯(lián)合訓(xùn)練,利用高精度機(jī)器人交互數(shù)據(jù)實(shí)現(xiàn)具身控制的精準(zhǔn)錨定。這一層整合優(yōu)質(zhì)開源機(jī)器人數(shù)據(jù)集與自研真實(shí)機(jī)器人交互數(shù)據(jù),聚焦雙臂協(xié)作、柔性操作等高價(jià)值場景,數(shù)據(jù)密度最高、動作錨定最精準(zhǔn),直接支撐模型感知表征與動作空間的原生對齊。

從 "堆砌數(shù)據(jù)混訓(xùn)" 到 "課程化漸進(jìn)習(xí)得",這套原生預(yù)訓(xùn)練范式通過 "以人為中心" 數(shù)據(jù)金字塔大幅提升了數(shù)據(jù)利用效率,讓不同來源的知識逐層沉淀、有機(jī)融合,既保留了大規(guī)模數(shù)據(jù)帶來的泛化性,又實(shí)現(xiàn)了機(jī)器人控制的高精度錨定,為原生統(tǒng)一架構(gòu)的能力落地筑牢了數(shù)據(jù)根基。

首創(chuàng)端側(cè)原生部署,讓世界模型走出云端走進(jìn)物理世界

物理 AI 產(chǎn)業(yè)落地的核心瓶頸,在于世界模型能否實(shí)現(xiàn)輕量化、高實(shí)時(shí)性的端側(cè)部署。Kairos 世界模型自底層架構(gòu)起便將部署效率列為核心原生設(shè)計(jì)準(zhǔn)則,依托算法蒸餾與硬件協(xié)同的全棧一體化優(yōu)化,顛覆行業(yè)內(nèi) "高性能世界模型必須綁定超大算力集群" 的固有認(rèn)知,達(dá)成消費(fèi)級終端流暢運(yùn)行、邊緣設(shè)備近實(shí)時(shí)推理的能力,徹底打破云端算力的部署局限,深度融入機(jī)器人實(shí)體運(yùn)動控制閉環(huán)。



首個(gè)世界模型驅(qū)動的端側(cè)具身大腦 Kairos-4B

Kairos 開悟世界模型采用算法、芯片雙向協(xié)同的部署一體化設(shè)計(jì),把端側(cè)算力、內(nèi)存、時(shí)延約束前置至模型研發(fā)全鏈路。算法側(cè)創(chuàng)新推出 "分布匹配 + 一致性約束" 混合時(shí)間步蒸餾框架,將傳統(tǒng)數(shù)十輪擴(kuò)散采樣精簡至僅 4 步,在近乎無損維持物理運(yùn)動一致性、畫面生成品質(zhì)的基礎(chǔ)上,從算法本源壓低推理時(shí)延理論下限;芯片側(cè)深度定制混合并行推理調(diào)度、DiT 特征緩存復(fù)用、算子內(nèi)核融合方案,疊加 FP8 低精度運(yùn)算、INT4 權(quán)重量化、分塊流式內(nèi)存讀寫多重優(yōu)化手段,在保障輸出精度不衰減的前提下,顯著降低顯存開銷與整體計(jì)算耗時(shí)。

實(shí)測驗(yàn)證數(shù)據(jù)表明:輕量化端側(cè)可用的 Kairos-4B 世界模型生成一段 480P、時(shí)長 5 秒的物理仿真視頻,4 卡 A800 硬件環(huán)境下僅需 3 秒即可完成;推理速度較同參數(shù)規(guī)格競品提升 2.5–3.7 倍,對比數(shù)十億參數(shù)通用世界模型,最高提速可達(dá) 85 倍。

一次范式級的躍遷

回到文章開頭那個(gè)耐人尋味的時(shí)刻 —— 當(dāng)英偉達(dá) Cosmos 3.0 采用與 Kairos 同源的架構(gòu)時(shí),它所印證的,其實(shí)是一條技術(shù)路線的正確性。

憑借原生技術(shù)體系的全棧式革新,Kairos 開悟世界模型實(shí)現(xiàn)了技術(shù)路線的范式級躍遷。以 "多模態(tài)理解 — 生成 — 預(yù)測" 原生一體化架構(gòu)、跨具身漸進(jìn)式訓(xùn)練體系、"以人為中心" 的數(shù)據(jù)金字塔,以及端側(cè)可部署的能力,系統(tǒng)性破解了行業(yè)長期存在的能力偏科、落地門檻高、長時(shí)程穩(wěn)定性不足等核心痛點(diǎn),打造 "一腦多型" 能力,為各種類型等多元實(shí)體場景提供了可規(guī)?;涞氐暮诵闹悄艿鬃?。

從 "世界生成器" 到 "理解世界、生成世界、與世界交互" 的物理智能大腦,Kairos 走的不是一條修補(bǔ)舊范式的路,而是從架構(gòu)底層重新出發(fā)。這,或許正是大曉機(jī)器人能比巨頭提前一步、并在四大全球基準(zhǔn)上全面登頂?shù)母驹颉?/p>

文中視頻鏈接:https://mp.weixin.qq.com/s/tKuXwuJxnnVG9gNph_NPCg

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
“月入2萬至3萬”是最幸福群體!上海薪資引熱議,186萬人成焦點(diǎn)

“月入2萬至3萬”是最幸福群體!上海薪資引熱議,186萬人成焦點(diǎn)

火山詩話
2026-06-17 18:31:57
央視主持人郭志堅(jiān):父母辛苦把他送進(jìn)名校,他卻將父母送進(jìn)養(yǎng)老院

央視主持人郭志堅(jiān):父母辛苦把他送進(jìn)名校,他卻將父母送進(jìn)養(yǎng)老院

時(shí)間巡查
2026-06-19 12:18:28
重慶95后女生拍下火山灰中的紙鸚鵡螺,捧回全球攝影大獎

重慶95后女生拍下火山灰中的紙鸚鵡螺,捧回全球攝影大獎

陌上桃花開的
2026-06-15 22:58:40
6國扎堆給菲律賓站臺,南海新變量已出現(xiàn),中方幫手來得正是時(shí)候

6國扎堆給菲律賓站臺,南海新變量已出現(xiàn),中方幫手來得正是時(shí)候

蕭獻(xiàn)記錄風(fēng)土人情
2026-06-19 10:02:40
4-1大勝!1-1絕平!次輪首日神奇一夜:積分榜亂了韓國或坐收漁利

4-1大勝!1-1絕平!次輪首日神奇一夜:積分榜亂了韓國或坐收漁利

大秦壁虎白話體育
2026-06-19 07:17:59
為什么飛機(jī)不能直接飛越西藏?四大因素,讓西藏成為“空中禁區(qū)”

為什么飛機(jī)不能直接飛越西藏?四大因素,讓西藏成為“空中禁區(qū)”

混沌錄
2026-06-18 19:13:49
現(xiàn)貨黃金日內(nèi)跌幅擴(kuò)大至2%,報(bào)4123.35美元/盎司

現(xiàn)貨黃金日內(nèi)跌幅擴(kuò)大至2%,報(bào)4123.35美元/盎司

每日經(jīng)濟(jì)新聞
2026-06-19 13:11:18
埃爾多安平息土耳其男足隊(duì)內(nèi)危機(jī)

埃爾多安平息土耳其男足隊(duì)內(nèi)危機(jī)

體壇周報(bào)
2026-06-18 18:44:39
印度電車需求暴漲,塔塔有訂單沒技術(shù),奇瑞只賣零件不交底牌

印度電車需求暴漲,塔塔有訂單沒技術(shù),奇瑞只賣零件不交底牌

阿嘵田侃故事
2026-06-18 08:46:09
震驚!曹德旺要福耀大學(xué)自負(fù)盈虧,網(wǎng)友:這是真正意義上的好大學(xué)

震驚!曹德旺要福耀大學(xué)自負(fù)盈虧,網(wǎng)友:這是真正意義上的好大學(xué)

火山詩話
2026-06-19 07:57:26
墨西哥成首支出線隊(duì)伍,孫興慜全場0射門,亞足聯(lián)球隊(duì)五連敗

墨西哥成首支出線隊(duì)伍,孫興慜全場0射門,亞足聯(lián)球隊(duì)五連敗

南方都市報(bào)
2026-06-19 12:28:28
85年67軍總部食堂遭遇槍擊,5位首長生死一線,兇手身份令人太意外

85年67軍總部食堂遭遇槍擊,5位首長生死一線,兇手身份令人太意外

睡前講故事
2026-01-09 13:44:42
從雷軍身邊走過的小女孩火了:也許最好的親民,從來不是演出來的

從雷軍身邊走過的小女孩火了:也許最好的親民,從來不是演出來的

十為先生
2026-06-18 12:51:43
央視熱播,40集刑偵巨制來襲!真實(shí)案件改編,演技派陣容,爆款

央視熱播,40集刑偵巨制來襲!真實(shí)案件改編,演技派陣容,爆款

喜歡歷史的阿繁
2026-06-19 04:03:49
西藏對中國意味著什么?西藏經(jīng)濟(jì)價(jià)值不高,為什么國家還要花大錢

西藏對中國意味著什么?西藏經(jīng)濟(jì)價(jià)值不高,為什么國家還要花大錢

掠影后有感
2026-06-18 10:21:46
八大軍區(qū)司令對調(diào),王洪文專門點(diǎn)名許世友,許怒懟:你帶兵不行!

八大軍區(qū)司令對調(diào),王洪文專門點(diǎn)名許世友,許怒懟:你帶兵不行!

北海史記
2026-06-19 11:36:56
長沙男子炫耀女兒美貌,結(jié)果被人指出是視頻女主角,最后悲劇發(fā)生

長沙男子炫耀女兒美貌,結(jié)果被人指出是視頻女主角,最后悲劇發(fā)生

清風(fēng)不留痕
2026-06-17 14:01:54
發(fā)配北境!灰熊莫蘭特時(shí)代宣布結(jié)束,換來奎克利進(jìn)行重建!

發(fā)配北境!灰熊莫蘭特時(shí)代宣布結(jié)束,換來奎克利進(jìn)行重建!

格斗聯(lián)盟有話說
2026-06-19 08:50:07
網(wǎng)友發(fā)帖問“幾個(gè)意思”,高中好友聊天尺度越來越大

網(wǎng)友發(fā)帖問“幾個(gè)意思”,高中好友聊天尺度越來越大

赴一場山海啊
2026-06-19 00:19:27
歷史上,這7個(gè)人本不可能做皇帝,卻天上掉餡餅“意外”登上皇位

歷史上,這7個(gè)人本不可能做皇帝,卻天上掉餡餅“意外”登上皇位

長風(fēng)文史
2026-06-18 22:47:47
2026-06-19 16:19:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
13299文章數(shù) 142674關(guān)注度
往期回顧 全部

科技要聞

Anthropic被禁,智譜卻漲瘋了

頭條要聞

男子醉駕撞死16歲少女 最初被認(rèn)定全責(zé)復(fù)議后變主責(zé)

頭條要聞

男子醉駕撞死16歲少女 最初被認(rèn)定全責(zé)復(fù)議后變主責(zé)

體育要聞

加拿大球員小腿變形重傷 亞洲冠軍輸球輸人

娛樂要聞

吳倩自曝小時(shí)被爸爸打掉牙齒硬吞進(jìn)肚

財(cái)經(jīng)要聞

Token低價(jià)陷阱

汽車要聞

驚出冷汗!重慶實(shí)測奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

本地
親子
藝術(shù)
公開課
軍事航空

本地新聞

世界杯黑馬佛得角:河北人開超市,溫州人當(dāng)老板

親子要聞

“全班停課10天”!深圳不少娃中招!廣東5月新增27849例,近期高發(fā)千萬留意

藝術(shù)要聞

臺北東區(qū)新門戶!南港雙星,像一道“城市裂痕”

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

霸氣!端午節(jié)最硬核的“龍舟”競渡來了

無障礙瀏覽 進(jìn)入關(guān)懷版