免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

ICLR 2026 Oral | Revela:用語言建模重新定義稠密檢索器訓(xùn)練

0
分享至



在檢索增強生成(RAG)系統(tǒng)中,稠密檢索器(Dense Retriever)負責(zé)從海量文檔庫中快速找出與查詢語義最相關(guān)的段落,是整個系統(tǒng)的核心基礎(chǔ)組件。

然而,訓(xùn)練一個高質(zhì)量的稠密檢索器并不容易。對比學(xué)習(xí)(Contrastive Learning)長期以來是這一領(lǐng)域的主流范式,但存在幾個根本性局限:

  • 嚴重依賴人工標注數(shù)據(jù):需要精心構(gòu)造查詢 - 文檔正負樣本對,在代碼、法律等專業(yè)領(lǐng)域標注成本極高;
  • 難負樣本的困境:隨機負樣本信號太弱,難負樣本挖掘又引入額外復(fù)雜性;
  • 與語言模型預(yù)訓(xùn)練目標割裂:對比損失與主流大模型的預(yù)訓(xùn)練范式(下一詞預(yù)測)天然不兼容,難以充分復(fù)用預(yù)訓(xùn)練知識。

這些問題在專業(yè)領(lǐng)域和推理密集型檢索場景下尤為突出。能否找到一條更自然、更統(tǒng)一的檢索器訓(xùn)練路徑?來自德國達姆施塔特工業(yè)大學(xué)(TU Darmstadt)的蔡豐宇及其來自華盛頓大學(xué)、卡內(nèi)基梅隆大學(xué)、微軟和騰訊 AI 實驗室的合作者給出了一個優(yōu)雅的答案 -Revela:Dense Retriever Learning via Language Modeling,并憑借這一回答斬獲ICLR 2026 Oral(約 1.1% 錄取率) 和FrontierIR @ AAAI 2026 最佳論文獎



  • 論文鏈接:https://openreview.net/forum?id=e7pAjJZJWb
  • 代碼鏈接:https://github.com/TRUMANCFY/Revela
  • 模型鏈接:https://huggingface.co/trumancai/Revela-3b

核心思路:讓檢索「像語言模型一樣學(xué)習(xí)」

Revela 的核心洞察在于:將稠密檢索器的訓(xùn)練目標統(tǒng)一到語言建??蚣苤?。

語言模型(LM)通過 "預(yù)測下一個 token" 來建模 token 之間的依賴關(guān)系。Revela 將這一思路類比到檢索:如果說 LM 建模的是 token 之間的依賴,那么檢索器建模的就是文本塊(chunk)之間的依賴

具體而言,Revela 引入了一種批內(nèi)注意力機制(In-batch Attention):在語言建模時,一個序列的下一詞預(yù)測不僅條件于自身上文,還通過檢索器計算的相似度權(quán)重,動態(tài)地參考批次中其他相關(guān)文檔。如圖 1 中,紅色文本塊在預(yù)測下一詞時 "參考" 了語義相近的紫色文本塊,這一過程反過來驅(qū)動檢索器提高兩者之間的相似度分數(shù)。檢索器的相似度分數(shù)就此直接嵌入語言建模的優(yōu)化目標,實現(xiàn)檢索器與語言模型的聯(lián)合端到端訓(xùn)練,無需任何人工標注的查詢 - 文檔對



圖 1:Revela 訓(xùn)練框架。檢索器相似度分數(shù)作為批內(nèi)注意力權(quán)重,與語言模型聯(lián)合端到端訓(xùn)練。紅、紫序列中高亮片段展示了檢索器如何學(xué)會關(guān)聯(lián)語義相近的文本塊。

這一設(shè)計帶來了三個關(guān)鍵優(yōu)勢:

  • 訓(xùn)練目標與預(yù)訓(xùn)練高度一致:語言建模正是大模型預(yù)訓(xùn)練所采用的目標,Revela 與之天然對齊,能充分激活預(yù)訓(xùn)練模型中已有的語義理解能力。
  • 完全自監(jiān)督,無需標注:原始文本自身的上下文關(guān)系即構(gòu)成訓(xùn)練信號,大幅降低對人工標注的依賴,使方法在數(shù)據(jù)稀缺的專業(yè)領(lǐng)域具備天然優(yōu)勢。
  • 可擴展性強:實驗表明,隨著檢索器規(guī)模(從 135M 到 3B)、語言模型規(guī)模和批大小的增大,性能持續(xù)穩(wěn)定提升,展現(xiàn)出良好的 Scaling 特性。

方法架構(gòu)

Revela 的整體架構(gòu)由兩部分組成:負責(zé)編碼文本,計算相似度的檢索器,以及提供語言建模訓(xùn)練信號的語言模型,二者在訓(xùn)練過程中聯(lián)合優(yōu)化。



圖 2:Revela 的 Transformer Block 架構(gòu)。

核心創(chuàng)新集中在 LM 的 Transformer Block 內(nèi)部(圖 2)。每一層同時運行兩條并行的注意力路徑:標準自注意力處理單條序列內(nèi)部的上下文依賴,輸出 ei;批內(nèi)注意力則在此基礎(chǔ)上引入跨文檔維度:先對序列自身做自注意力得到 si,再以檢索器輸出的相似度分數(shù)為權(quán)重,對批次內(nèi)其他文檔的自注意力輸出 ej做交叉注意力并加權(quán)聚合得到 bi,最終輸出 hi= si+ bi。其中,檢索器將批次內(nèi)所有文檔編碼為向量,通過兩兩余弦相似度并經(jīng) softmax 歸一化,得到文檔間的相似度權(quán)重矩陣,直接作為批內(nèi)注意力的聚合權(quán)重。

值得注意的是,跨文檔注意力的 Key 和 Value 均來自其他文檔的 ej,而非 hj,這一設(shè)計使批內(nèi)注意力能夠使用只含有序列內(nèi)部信息的自注意力。兩路路徑對應(yīng)圖 2 注意力圖中左上與右下兩個區(qū)域,最終輸出相加后送入前饋層,共同驅(qū)動下一詞預(yù)測目標。這一設(shè)計使檢索器的相似度分數(shù)直接參與 LM 的反向傳播,檢索器由此得以被端到端優(yōu)化。

在訓(xùn)練數(shù)據(jù)構(gòu)建上,Revela 將文檔切分為 chunk 并分批,確保每個 batch 內(nèi)包含語義相關(guān)的片段,使語言建模信號天然對應(yīng)有意義的跨文本依賴。訓(xùn)練數(shù)據(jù)方面,通用檢索使用約 34 萬篇維基百科文檔,代碼檢索使用 StackOverflow 帖子、技術(shù)教程和庫文檔,均無需任何人工標注的查詢-文檔對。

實驗效果:無標注數(shù)據(jù),超越商業(yè) API

Revela 在三大權(quán)威基準上進行了系統(tǒng)評估,分別覆蓋代碼檢索(CoIR)推理密集型檢索(BRIGHT)通用信息檢索(BEIR)三個維度。



表 1:CoIR 代碼檢索基準上各模型的檢索性能(nDCG@10,%)。

代碼檢索(CoIR): Revela-3B 在 10 項任務(wù)平均 nDCG@10 達到 60.1,在無需任何查詢 - 文檔標注對的前提下,超越了使用海量標注數(shù)據(jù)訓(xùn)練的 7B 參數(shù)有監(jiān)督模型 E5-Mistral-7b-Instruct(57.3)以及 OpenAI Ada-002(45.6)、Voyage-Code-002(56.3)兩個商業(yè) API。在 0.5B 參數(shù)規(guī)模下,Revela 即超越了同樣覆蓋代碼語料、用 2.7 億標注對訓(xùn)練的 E5-PT,領(lǐng)先約 10 個百分點。



圖 3:BRIGHT(左)與 BEIR(右)基準上的檢索性能對比(nDCG@10,%)。

推理密集檢索(BRIGHT): Revela-3B 平均 nDCG@10 達到 20.1,僅憑維基百科文本訓(xùn)練,便超越了 E5-Mistral-7b-Instruct(17.9)以及 text-embedding-3-large(OpenAI,17.9)、voyage-large-2-instruct(Voyage,17.9)、cohere-embed-english-v3.0(Cohere,16.6)等主流商業(yè) API,充分體現(xiàn)了語言建模目標對深層語義推理能力的激活效果。

通用檢索(BEIR): Revela-3B 與弱監(jiān)督基線 E5-PT 持平(均為 45.6),但所用訓(xùn)練數(shù)據(jù)約為其 1/1000,使用計算資源僅為其 1/10,極大降低了訓(xùn)練成本。

意義與展望

Revela 將稠密檢索器的訓(xùn)練與語言建模范式統(tǒng)一,打開了多個值得探索的方向:

動態(tài)索引構(gòu)建:Revela 目前通過文檔分塊來保證 batch 內(nèi)的語義相關(guān)性,更理想的做法是用模型的實時表示對 chunk 動態(tài)分組,但這意味著需要在訓(xùn)練過程中持續(xù)更新索引,計算成本是亟待解決的挑戰(zhàn)。模型與數(shù)據(jù)的進一步擴展:實驗已驗證 Revela 在模型規(guī)模和 batch 大小上具備良好的 Scaling 特性,擴大訓(xùn)練語料覆蓋范圍、引入更高效的注意力機制,有望帶來進一步的性能提升。反哺語言模型訓(xùn)練:Revela 目前將 LM 視為輔助的訓(xùn)練信號來源,但檢索器所學(xué)到的文本間語義關(guān)聯(lián),同樣可以反過來用于指導(dǎo) LM 的 batch 構(gòu)建,探索對語言模型本身的改善潛力。

該成果已以 Oral 形式發(fā)表于頂級 AI 會議 ICLR 2026。本屆 ICLR 共收到近兩萬篇投稿,Oral 僅 兩百余篇,錄取率約 1.1%,是對 Revela 在自監(jiān)督檢索學(xué)習(xí)領(lǐng)域創(chuàng)新價值的高度認可。

作者介紹

蔡豐宇,德國達姆施塔特工業(yè)大學(xué)(TU Darmstadt)四年級博士,師從 ACL fellow,前 ACL 主席 Iryna Gurevych 教授及 Heinz Koeppl 教授。他研究方向涵蓋稠密檢索、RAG 及 AI for science,在 ICLR,ACL, EMNLP,CVPR 等會議上發(fā)表論文十余篇。本碩分別畢業(yè)于香港科技大學(xué)(HKUST)與洛桑聯(lián)邦理工學(xué)院(EPFL)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
周冬雨被曝演話劇不背臺詞,熱搜第一

周冬雨被曝演話劇不背臺詞,熱搜第一

大風(fēng)新聞
2026-06-18 13:33:03
日本球迷表示,看世界杯比賽,最不喜歡跟中國國足的球迷挨著坐

日本球迷表示,看世界杯比賽,最不喜歡跟中國國足的球迷挨著坐

酷侃體壇
2026-06-18 22:58:24
網(wǎng)傳各廠都趕在6月底裁員,35歲即便清華,也很困難…

網(wǎng)傳各廠都趕在6月底裁員,35歲即便清華,也很困難…

慧翔百科
2026-06-18 08:28:47
烏克蘭正贏得戰(zhàn)爭:目標每月殺傷俄軍從3.5萬提升至5萬,用無人機改變戰(zhàn)局

烏克蘭正贏得戰(zhàn)爭:目標每月殺傷俄軍從3.5萬提升至5萬,用無人機改變戰(zhàn)局

可達鴨面面觀
2026-06-18 11:59:01
世界杯48隊完成首秀!進球最多的是“烏龍”,其次是梅西

世界杯48隊完成首秀!進球最多的是“烏龍”,其次是梅西

大象新聞
2026-06-18 14:10:22
羅翔說:電視上演的都是,給你多少萬,離開我女兒;而現(xiàn)實中卻是,給我們多少萬,否則離開我女兒

羅翔說:電視上演的都是,給你多少萬,離開我女兒;而現(xiàn)實中卻是,給我們多少萬,否則離開我女兒

背包旅行
2026-06-18 14:23:32
鄭欽文排名斷崖式下跌:資本迅速撤離,曾經(jīng)追捧她的品牌去哪了

鄭欽文排名斷崖式下跌:資本迅速撤離,曾經(jīng)追捧她的品牌去哪了

財經(jīng)保探長
2026-06-18 23:35:15
私生活混亂、被央視“開除”、陪睡上位,她身上哪個標簽是真的?

私生活混亂、被央視“開除”、陪睡上位,她身上哪個標簽是真的?

素衣讀史
2026-06-18 21:37:31
山西運城“冒充警察打人事件”,提級調(diào)查!

山西運城“冒充警察打人事件”,提級調(diào)查!

新動察
2026-06-18 08:31:27
這回中國可能真要栽大跟頭,投資的錢估計要全砸進去收不回來!

這回中國可能真要栽大跟頭,投資的錢估計要全砸進去收不回來!

云鵬敘事
2026-06-17 19:55:03
中午12點!CCTV5直播日本隊世界杯“生死戰(zhàn)”,輸球=小組難晉級

中午12點!CCTV5直播日本隊世界杯“生死戰(zhàn)”,輸球=小組難晉級

麥子的籃球故事
2026-06-18 12:56:54
乘坐飛機,發(fā)現(xiàn)一個空姐很像豆包,蚌埠住了。

乘坐飛機,發(fā)現(xiàn)一個空姐很像豆包,蚌埠住了。

微微熱評
2026-06-18 12:42:56
馬卡:皇馬可能2.2億歐報價奧利塞,這與恩佐的交易是分開的

馬卡:皇馬可能2.2億歐報價奧利塞,這與恩佐的交易是分開的

懂球帝
2026-06-18 22:20:24
寶媽避雨被趕后續(xù):大批顧客退單,商家道歉也無果,門店口碑崩了

寶媽避雨被趕后續(xù):大批顧客退單,商家道歉也無果,門店口碑崩了

千言娛樂記
2026-06-18 18:59:27
陳芋汐抵達上海正式上任,新崗位亮相,工資首次曝光,全紅嬋祝福

陳芋汐抵達上海正式上任,新崗位亮相,工資首次曝光,全紅嬋祝福

以茶帶書
2026-06-18 19:32:09
轟動全網(wǎng)的北京“退衣姐”被刑拘事件:我們還是低估了這群人的不要臉

轟動全網(wǎng)的北京“退衣姐”被刑拘事件:我們還是低估了這群人的不要臉

桌子的生活觀
2026-06-18 12:30:11
凌晨1點!CCTV5直播梅西沖擊歷史第一人,阿根廷贏球=小組出線

凌晨1點!CCTV5直播梅西沖擊歷史第一人,阿根廷贏球=小組出線

鳴哥說體育
2026-06-18 16:47:22
世界杯一輪戰(zhàn)罷!誰能夠奪冠一目了然,這 2 隊或進入總決賽

世界杯一輪戰(zhàn)罷!誰能夠奪冠一目了然,這 2 隊或進入總決賽

體壇狗哥
2026-06-18 23:10:09
外媒:梅西父親豪爾赫正與胰腺癌抗爭,情況令人擔憂

外媒:梅西父親豪爾赫正與胰腺癌抗爭,情況令人擔憂

懂球帝
2026-06-18 15:58:12
特朗普曾驚奇發(fā)現(xiàn)1個世紀漏洞,只要不招惹中國,那就沒一個能打

特朗普曾驚奇發(fā)現(xiàn)1個世紀漏洞,只要不招惹中國,那就沒一個能打

浪子阿邴聊體育
2026-06-18 03:02:37
2026-06-19 05:20:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
13299文章數(shù) 142673關(guān)注度
往期回顧 全部

科技要聞

庫克承認扛不住了,蘋果漲價“不可避免”

頭條要聞

159瓶茅臺被扣3年后多瓶失蹤 警方:酒仍處于扣押時狀態(tài)

頭條要聞

159瓶茅臺被扣3年后多瓶失蹤 警方:酒仍處于扣押時狀態(tài)

體育要聞

英格蘭不再九子奪嫡,凱恩才是唯一真神

娛樂要聞

39歲梅西不愧是人生贏家!

財經(jīng)要聞

博??礗PO,賺錢業(yè)務(wù)與資本敘事是兩門生意

汽車要聞

驚出冷汗!重慶實測奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

數(shù)碼
游戲
健康
公開課
軍事航空

數(shù)碼要聞

銘瑄公布MCIO接口ITX主板方案,展示高密度接口優(yōu)勢

PS5版《GTA6》已有店家開始預(yù)定!售價545元

吃粽子的3條保胃法則,消化科醫(yī)生推薦

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗外交部:美伊已簽署諒解備忘錄

無障礙瀏覽 進入關(guān)懷版