免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

小鵬智駕一把手AI頂會演講:VLA和世界模型不對立,基座模型才能通往L4

0
分享至


車東西(公眾號:chedongxi)
作者 | 郭月
編輯 | 志豪

車東西6月4日消息,就在今天,被譽為“學術(shù)界奧斯卡”的全球計算機視覺頂級會議CVPR 2026在美國丹佛開幕,小鵬集團通用智能中心負責人劉先明首次展示小鵬世界模型技術(shù)圖譜。


▲小鵬集團通用智能中心負責人劉先明在CVPR發(fā)表演講

在CVPR現(xiàn)場,劉先明表示,小鵬集團正在研發(fā)具備主動思考、可控生成和長時序推演能力的世界模型。

世界模型與第二代VLA不是互相替代或互相競爭的關(guān)系,而是通過不同訓(xùn)練信號共同提升模型對物理世界的理解能力和在物理世界的行動能力。

它們本質(zhì)上在做同一件事:通過不斷放大模型規(guī)模、數(shù)據(jù)規(guī)模和訓(xùn)練目標的復(fù)雜度,訓(xùn)練足夠強大的物理世界基座模型。

劉先明介紹,小鵬物理世界基座模型,是第二代VLA,也是世界模型。

在小鵬的基座模型架構(gòu)中,第二代VLA主要從人類駕駛行為中學習,將視頻流、指令與動作輸出進行統(tǒng)一建模,掌握在復(fù)雜交通環(huán)境中合理行動的能力。

世界模型則通過對未來狀態(tài)和場景演化的預(yù)測,學習物理世界的運行規(guī)律,并支持可控生成、長時序推演和因果推理。前者讓模型學習“如何行動”,后者讓模型理解“行動之后世界會如何變化”。

二者結(jié)合,最終目標是構(gòu)建能夠深度理解真實世界并在其中安全行動的物理AI基座模型。

劉先明還強調(diào)了他此前的判斷,只有能做基座模型的公司,才有可能真的做到L4,自動駕駛只是小鵬基座模型落地的第一步,未來,基模還將應(yīng)用到機器人、飛行汽車等更多具身載體。

一、世界模型與第二代VLA結(jié)合 打造物理世界基座模型

作為AI領(lǐng)域最有影響力的頂會,CVPR歷來都是AI研究的風向標,今年大會首次開設(shè)“具身智能基座模型部署研討會”,邀請?zhí)厮估瑼I 軟件副總裁Ashok Elluswamy、小鵬集團通用智能中心負責人劉先明等分享各自團隊的研究成果。


▲小鵬特斯拉英偉達高管同框

“走VLA路線還是世界模型路線?”對于這個爭論不休的技術(shù)議題,劉先明在CVPR現(xiàn)場做出了回答:小鵬物理世界基座模型,是第二代VLA,也是世界模型,本質(zhì)上都是在訓(xùn)練足夠強大的物理世界基座模型。


▲小鵬物理世界基座模型技術(shù)圖譜

人類動作包含豐富的高層語義,隱性地編碼了感知、推理、意圖、風險判斷、社交互動以及對物理世界的理解;只是這類監(jiān)督信號在時間上相對稀疏。它通常只能監(jiān)督最終的行為結(jié)果,而難以覆蓋促成這一行為過程中每一次潛在的物理狀態(tài)轉(zhuǎn)移。

世界模型則是從世界本身中學習的。它不只是預(yù)測下一步動作,還可以預(yù)測未來狀態(tài)、未來觀測,或者潛在空間中的未來表征。

相比之下,它所獲得的監(jiān)督信號要密集得多:每一幀畫面、每一次運動、每一次交互都可以成為訓(xùn)練信號。

世界模型借鑒了大語言模型中“下一個Token預(yù)測”的范式,通過在海量未標注視頻上進行下一幀或下一狀態(tài)的密集預(yù)測,逐步學會物理世界的動力學與因果結(jié)構(gòu)。

通過這種融合架構(gòu),小鵬成功將稀疏的人類意圖與密集的物理預(yù)測相結(jié)合,使得模型不僅在學習“人類駕駛員會怎么做”,更在深度理解“物理世界接下來會發(fā)生什么”。

這種雙重目標的并行演進,確保了系統(tǒng)在復(fù)雜環(huán)境下的可控性與安全性,也為自動駕駛系統(tǒng)賦予了更深層次的物理感知與邏輯推理能力。

二、世界模型的三重能力:主動思考、可控生成和長時序推演

劉先明認為,一個優(yōu)秀的世界模型必須具備三大能力:主動思考、可控生成和長時序推演,這是智能的體現(xiàn),也是世界模型能在自動駕駛領(lǐng)域應(yīng)用的前提條件。

事實上,小鵬研發(fā)團隊近期發(fā)表了一系列與世界模型相關(guān)的學術(shù)論文,圍繞這幾個核心能力拆解小鵬世界模型的研究方法。

《X-World: Controllable Ego-Centric Multi-Camera World Models for Scalable End-to-End Driving 》介紹了X-World,基于視頻擴散生成技術(shù)構(gòu)建的可控多視角生成式世界模型,能在給定動作條件下生成符合物理約束的未來視頻,同時在持續(xù)生成過程中保持良好的可控性與穩(wěn)定性。X-World現(xiàn)已投入到閉環(huán)仿真測試、在線強化學習、數(shù)據(jù)生成等研發(fā)環(huán)節(jié)。

《X-Foresight: A Joint Vision-Action Causal Forecasting Network via Predictive World Modeling》介紹了X-Foresight,一套基于預(yù)測式世界模型的視覺-動作因果預(yù)測網(wǎng)絡(luò),X-Foresight在架構(gòu)上與VLA融為一體,在統(tǒng)一的token空間內(nèi)聯(lián)合預(yù)測未來的多視角畫面與自車動作,為VLA的控車決策提供了核心支撐。X-Foresight的預(yù)測式?jīng)Q策邏輯,倒逼模型“理解世界”,掌握車輛、行人運動規(guī)律與場景因果鏈條。

此外,小鵬研發(fā)團隊還在《X-Cache: Cross-Chunk Block Caching for Few-Step Autoregressive World Models Inference》中提出了“世界模型加速器”X-Cache,一個面向少步自回歸世界模型的跨段塊級緩存,能在基本不犧牲畫質(zhì)的前提下,減少約七成的重復(fù)計算,對世界模型的去噪主干實現(xiàn)最高約2.7倍的推理加速。

劉先明透露,近期還將發(fā)表名為“X-mind”的論文,解析模型如何“主動思考”,并可視化地呈現(xiàn)駕駛決策背后的中間推理過程??山忉屝詫τ谧詣玉{駛的軟件性能調(diào)試、用戶信任建立以及模型快速迭代都至關(guān)重要。


▲劉先明在X平臺上發(fā)文介紹世界模型

三、規(guī)模法則持續(xù)生效 基模將應(yīng)用到更多具身載體

去年CVPR,劉先明的演講題目是《通過大規(guī)?;A(chǔ)模型實現(xiàn)自動駕駛的規(guī)?;罚鞔_表示,小鵬研發(fā)團隊驗證了規(guī)模法則(Scaling Law)在自動駕駛VLA模型上的持續(xù)生效。

做AI,沒有那么多“炸裂”和“震驚”瞬間,更多是持之以恒踐行規(guī)模法則這樣“簡單的道理”,不斷挖掘技術(shù)紅利。

目前,小鵬第二代VLA模型擁有數(shù)十億參數(shù)量,使用了上億的視頻片段作為訓(xùn)練數(shù)據(jù),每版模型的訓(xùn)練量超過4萬億Token。

小鵬集團此前透露,研發(fā)團隊平均每天能夠迭代數(shù)版模型,高頻節(jié)奏的背后是其強大的AI基礎(chǔ)設(shè)施能力。

小鵬是國內(nèi)最早建成萬卡以上規(guī)模智算集群的企業(yè),在截至今年3月的一年間,小鵬集群的單GPU訓(xùn)練效率提升了1010%、單任務(wù)訓(xùn)練效率提升了4360%,GPU硬件利用率從40%提升到了90%,達到頭部AI公司的標準。

另一方面,小鵬通過對芯片、編譯器、模型的軟硬件聯(lián)合開發(fā),小鵬大幅提升了車端芯片有效算力,將車端模型推理速度提升了12倍。


▲小鵬車端模型推理速度提升了12倍

劉先明展示了三組芯片&模型組合的對比數(shù)據(jù):使用開源模型和通用芯片,計算利用率為22.8%、推理時延800毫秒;使用開源模型和小鵬自研的圖靈芯片,模型計算利用率為35.1%、推理時延300毫秒;使用自研的第二代VLA模型和自研圖靈芯片后,計算利用率大幅提升到82.5%、時延壓縮至80毫秒。

據(jù)悉,自動駕駛只是小鵬基座模型落地的第一步,未來,基模還將應(yīng)用到機器人、飛行汽車等更多具身載體。小鵬人形機器人IRON面向量產(chǎn)版本的軟硬件研發(fā)進展順利,即將進入軟硬件合圍階段。

劉先明不止一次表示,只有能做基座模型的公司,才有可能真的做到L4,并進一步賦能機器人、飛行汽車等多種具身載體。而基座模型,本身就需要軟-硬、端-云、AI研發(fā)-先進制造等全棧技術(shù)的托舉。

結(jié)語:小鵬為物理AI鋪下基石

當行業(yè)仍在爭論“VLA”與“世界模型”誰才是自動駕駛的終局方案時,小鵬給出的回答是——兩者本為一體。

在CVPR 2026上,小鵬首次完整呈現(xiàn)了物理世界基座模型的技術(shù)圖譜:第二代VLA讓模型學會“像人一樣行動”,世界模型則讓它理解“行動之后世界會怎樣變化”。

小鵬將二者能力融合,不只是帶來自動駕駛算法的進化,更創(chuàng)造了一套可供機器人、飛行汽車等任意具身載體復(fù)用的通用智能范式,打造了一個可以持續(xù)學習、推理和進化的“大腦”,為物理AI 時代的到來鋪下基石。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
貨交了錢飛了!大連重工被印度兩家公司賴1.4億,贏了仲裁更窩火

貨交了錢飛了!大連重工被印度兩家公司賴1.4億,贏了仲裁更窩火

天氣觀察站
2026-06-19 00:23:48
大媽順走奔馳螺絲后續(xù)!長相曝光,被老板找到后說:以為你不要了

大媽順走奔馳螺絲后續(xù)!長相曝光,被老板找到后說:以為你不要了

寒士之言本尊
2026-06-18 17:37:03
2026NBA選秀多位潛力落選秀受關(guān)注

2026NBA選秀多位潛力落選秀受關(guān)注

體壇周報
2026-06-20 02:27:10
全球加息潮驟然來襲!高志凱預(yù)言落地,金融海嘯或提前殺到?

全球加息潮驟然來襲!高志凱預(yù)言落地,金融海嘯或提前殺到?

時光在作祟
2026-06-20 03:27:10
1965年毛主席上井岡山,汪東興發(fā)現(xiàn)一人萬分驚訝,主席:為他調(diào)崗

1965年毛主席上井岡山,汪東興發(fā)現(xiàn)一人萬分驚訝,主席:為他調(diào)崗

兵卒史
2026-06-20 03:03:57
洋蔥立大功!醫(yī)生發(fā)現(xiàn):洋蔥或?qū)?種慢性病有好處!可以常吃

洋蔥立大功!醫(yī)生發(fā)現(xiàn):洋蔥或?qū)?種慢性病有好處!可以常吃

芹姐說生活
2026-05-25 14:19:45
金融男的三件套,變了

金融男的三件套,變了

叫我娛樂菌
2026-03-30 19:35:53
吳越后臺偶遇陳建斌側(cè)身避開,成年人的邊界,不必勉強大度

吳越后臺偶遇陳建斌側(cè)身避開,成年人的邊界,不必勉強大度

草莓解說體育
2026-06-19 14:10:53
日本愁慌了,韓國著急了,那座叫棗莊的中國煤城,煤早已不只是煤

日本愁慌了,韓國著急了,那座叫棗莊的中國煤城,煤早已不只是煤

阿嘵田侃故事
2026-06-17 22:13:29
美專家意見罕見一致:待中國兩岸統(tǒng)一,美國或只剩下1條可行之路

美專家意見罕見一致:待中國兩岸統(tǒng)一,美國或只剩下1條可行之路

流史歲月
2026-06-17 20:00:09
俄媒提醒:比起稀土中國手里還有一張王牌,才是讓美歐真正忌憚的

俄媒提醒:比起稀土中國手里還有一張王牌,才是讓美歐真正忌憚的

影孖看世界
2026-06-19 23:29:37
蔣宋孔陳的后人現(xiàn)狀:蔣家多數(shù)遠離政壇,陳家孫輩皆成棟梁

蔣宋孔陳的后人現(xiàn)狀:蔣家多數(shù)遠離政壇,陳家孫輩皆成棟梁

野蠻不失女人心
2024-10-05 10:07:55
國際油價直線跳水,外媒稱以色列與黎巴嫩真主黨已同意?;?>
    </a>
        <h3>
      <a href=21世紀經(jīng)濟報道
2026-06-19 22:10:50
向華強懵了!砸數(shù)億捧半生都沒紅的向佐,被易立竟采訪推上頂峰

向華強懵了!砸數(shù)億捧半生都沒紅的向佐,被易立竟采訪推上頂峰

一盅情懷
2026-06-19 08:46:51
2026年養(yǎng)老金調(diào)整或即將啟動,補發(fā)7個月,工齡15年補多少?

2026年養(yǎng)老金調(diào)整或即將啟動,補發(fā)7個月,工齡15年補多少?

虎哥閑聊
2026-06-19 08:45:56
世界杯最魔幻時刻:同一個“國家”,四支球隊奏四種國歌

世界杯最魔幻時刻:同一個“國家”,四支球隊奏四種國歌

勇哥讀史
2026-06-19 11:07:47
這下熱鬧了!太平島一聲炮響,越南第一個蹦出來叫陣

這下熱鬧了!太平島一聲炮響,越南第一個蹦出來叫陣

阿七說史
2026-04-29 15:17:43
協(xié)議剛簽完就萬彈齊發(fā)!伊朗盟友連夜飽和式突襲,中東格局將改寫

協(xié)議剛簽完就萬彈齊發(fā)!伊朗盟友連夜飽和式突襲,中東格局將改寫

孫縭北漂拍客
2026-06-18 23:12:26
意大利太可惜!淘汰他們的對手,到世界杯贏不了,2輪1分基本出局

意大利太可惜!淘汰他們的對手,到世界杯贏不了,2輪1分基本出局

侃球熊弟
2026-06-19 05:03:45
金價大跳水!金飾克價一夜下跌44元

金價大跳水!金飾克價一夜下跌44元

新浪財經(jīng)
2026-06-19 12:04:58
2026-06-20 04:23:00
車東西
車東西
未來汽車看這里。
6246文章數(shù) 6419關(guān)注度
往期回顧 全部

科技要聞

Anthropic被禁,智譜卻漲瘋了

頭條要聞

特朗普:伊朗走投無路徹底完蛋了 我們就把這60天耗完

頭條要聞

特朗普:伊朗走投無路徹底完蛋了 我們就把這60天耗完

體育要聞

世界杯最不知名球員,沒上場先漲粉600萬

娛樂要聞

孫藝珍曬母子合照!4歲小甜豆暴風成長

財經(jīng)要聞

Token低價陷阱

汽車要聞

驚出冷汗!重慶實測奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

教育
數(shù)碼
旅游
健康
房產(chǎn)

教育要聞

高考送考就是全社會對孩子最大的溺愛!

數(shù)碼要聞

SSD太貴換回HDD:機械硬盤價格連漲5個季度!

旅游要聞

走遍春城才懂,金馬山不只是地名,是云南人代代相傳的祥瑞浪漫!

吃粽子的3條保胃法則,消化科醫(yī)生推薦

房產(chǎn)要聞

商業(yè)清零式退潮,大量住宅登場!三亞又要大規(guī)模調(diào)規(guī)!

無障礙瀏覽 進入關(guān)懷版