免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

BudgetMem:給Runtime Agent Memory裝上「預(yù)算路由器」

0
分享至



Haozhen Zhang 現(xiàn)為 Nanyang Technological University(NTU)博士生,導(dǎo)師 Wenya Wang 為 NTU 計(jì)算機(jī)與數(shù)據(jù)科學(xué)學(xué)院助理教授。團(tuán)隊(duì)研究聚焦 LLM Agent Memory、LLM Interpretability 與高效智能體系統(tǒng),關(guān)注大語言模型在 reasoning、memory 與 multimodal grounding 等方面的能力構(gòu)建,致力于發(fā)展更可解釋、高效且具備泛化能力的大模型系統(tǒng)。本工作同時與香港科技大學(xué)(廣州)Chengwei Qin 老師合作完成;Chengwei Qin 現(xiàn)為香港科技大學(xué)(廣州)人工智能學(xué)域助理教授,主要關(guān)注大語言模型智能體、多模態(tài)學(xué)習(xí)以及模型的高效學(xué)習(xí)。

BudgetMem:給 Runtime Agent Memory 裝上 “預(yù)算路由器”

讓記憶系統(tǒng)學(xué)會按需分配運(yùn)行成本

當(dāng) LLM Agent 處理長期對話、多輪交互和復(fù)雜文檔時,Memory 已經(jīng)成為不可或缺的核心模塊。它幫助智能體保存歷史、檢索信息、維持個性化上下文,并支撐跨時間的推理能力。

但一個現(xiàn)實(shí)問題常常被忽視:Agent Memory 到底應(yīng)該花多少成本來處理歷史?

如果一個 query 只需要簡單事實(shí),是否有必要調(diào)用昂貴的 LLM 進(jìn)行復(fù)雜總結(jié)?如果一個 query 依賴跨時間、跨實(shí)體、跨主題的多條證據(jù),低成本檢索和粗粒度摘要又是否足夠?

對此,研究團(tuán)隊(duì)提出BudgetMem: Learning Query-Aware Budget-Tier Routing for Runtime Agent Memory,旨在讓 Agent Memory 從固定的記憶處理流水線,轉(zhuǎn)向 query-aware 的動態(tài)預(yù)算分配機(jī)制:對于簡單 query 使用低成本處理路徑,對于復(fù)雜 query 則自動調(diào)用更高質(zhì)量的記憶模塊。



  • 論文:《Learning Query-Aware Budget-Tier Routing for Runtime Agent Memory》
  • 鏈接:https://arxiv.org/abs/2602.06025

背景:固定記憶流水線難以適應(yīng)不同 Query

現(xiàn)有很多 Agent Memory System 仍然遵循一種固定范式:先離線構(gòu)建記憶,再在未來統(tǒng)一檢索使用。

這種build once, use always的方式雖然直觀,但存在兩個問題。首先,它是 query-agnostic 的。系統(tǒng)在不知道未來問題的情況下提前壓縮歷史,可能會丟掉后續(xù) query 真正需要的細(xì)節(jié)。其次,它缺乏顯式的 performance-cost control。簡單問題和復(fù)雜問題往往被同一套流程處理,前者可能浪費(fèi)成本,后者又可能預(yù)算不足。

因此,本文關(guān)注一個更貼近真實(shí)部署的問題:當(dāng) query 到來時,記憶系統(tǒng)應(yīng)該花多少計(jì)算去處理歷史?

Runtime Query-Aware Memory Extraction

BudgetMem 將記憶構(gòu)建從固定離線流程轉(zhuǎn)向runtime query-aware extraction。系統(tǒng)首先將歷史保留為原始 chunks,當(dāng)用戶 query 到來時,再檢索相關(guān)片段,并通過模塊化流水線構(gòu)建 query-focused memory。

在本文實(shí)驗(yàn)中,團(tuán)隊(duì)采用了一個簡單且可解釋的模塊化實(shí)例:

Filtering → Entity / Temporal / Topic Extraction → Summarization

其中,F(xiàn)iltering 負(fù)責(zé)篩選相關(guān) chunks;Entity、Temporal、Topic 模塊分別提取實(shí)體、時間和主題相關(guān)信息;Summary 模塊最終整合為面向當(dāng)前 query 的記憶。

需要強(qiáng)調(diào)的是,這一模塊組合只是 BudgetMem 在實(shí)驗(yàn)中的具體實(shí)例,并不是框架本身的限制。BudgetMem 的核心在于為模塊化 memory pipeline 提供統(tǒng)一的 budget-tier interface,因此也可以適配到其他 memory modules 或不同形式的記憶處理流水線中。

關(guān)鍵在于,每個 memory module 都提供LOW / MID / HIGH三種 budget tiers。也就是說,同一個模塊既可以用低成本方式執(zhí)行,也可以用更高質(zhì)量但更昂貴的方式執(zhí)行。這樣,記憶系統(tǒng)不再固定調(diào)用同一套流程,而是根據(jù)當(dāng)前 query 的復(fù)雜度和信息需求,動態(tài)選擇合適的記憶處理路徑。



三種 Budget-Tier 策略

為了系統(tǒng)研究 runtime memory 中的性能成本權(quán)衡,BudgetMem 比較了三種 budget-tier realization strategies。

Implementation Tiering:改變模塊實(shí)現(xiàn)方式,從規(guī)則 / 啟發(fā)式方法,到輕量模型,再到 LLM-based 模塊。

Reasoning Tiering:改變推理行為,從 direct extraction,到 CoT-style reasoning,再到 multi-step 或 reflection-style processing。

Capacity Tiering:改變模型大小,用不同規(guī)模的模型實(shí)現(xiàn)同一個 memory module。

這三種策略分別對應(yīng)算法復(fù)雜度、推理深度和模型規(guī)模三個預(yù)算軸,使 BudgetMem 不只是一個省 token trick,而是一個系統(tǒng)研究 runtime memory performance-cost trade-off 的統(tǒng)一框架。

用強(qiáng)化學(xué)習(xí)訓(xùn)練 Budget Router

BudgetMem 設(shè)計(jì)了一個輕量級Budget Router,在 runtime memory extraction 的每一步為當(dāng)前模塊選擇合適的預(yù)算檔位。Router 會根據(jù) query、當(dāng)前模塊輸入和模塊描述,動態(tài)決定該模塊使用LOW / MID / HIGH哪一檔,從而在低成本處理和高質(zhì)量提取之間做出取舍。

由于整個 memory extraction 過程包含離散的檢索、規(guī)則、小模型和 LLM 調(diào)用,難以直接端到端求導(dǎo),本文將 budget-tier selection 建模為一個sequential decision problem,并使用強(qiáng)化學(xué)習(xí)訓(xùn)練 Router。

每個 query 的處理過程對應(yīng)一個 episode。最終回答質(zhì)量作為task reward,記憶提取成本作為cost reward。通過調(diào)節(jié) cost weight,BudgetMem 可以在performance-firstcost-sensitive設(shè)置之間靈活切換:預(yù)算寬松時優(yōu)先提升記憶質(zhì)量和回答性能,預(yù)算緊張時則主動選擇低成本路徑,降低整體調(diào)用開銷。

實(shí)驗(yàn)結(jié)果

在效果與成本之間取得更優(yōu)權(quán)衡

本文在 LoCoMo、LongMemEval 和 HotpotQA 上評估 BudgetMem,并與 ReadAgent、MemoryBank、A-MEM、Mem0、MemoryOS、LightMem 等強(qiáng)基線比較。實(shí)驗(yàn)顯示,在 performance-first 設(shè)置下,BudgetMem 在 F1 和 LLM-Judge 上整體優(yōu)于現(xiàn)有 memory baselines。



同時,當(dāng)我們調(diào)節(jié) cost weight 時,BudgetMem 能形成連續(xù)、可控的 performance-cost frontier:在相近成本下取得更好效果,在相近效果下降低記憶提取成本。

進(jìn)一步分析表明,不同 tiering strategy 適用于不同場景。Implementation 和 Capacity Tiering 覆蓋更寬的預(yù)算范圍,更適合從低成本到高性能的部署需求;Reasoning Tiering 更像細(xì)粒度質(zhì)量調(diào)節(jié)旋鈕,適合在相近成本區(qū)間內(nèi)進(jìn)一步提升記憶質(zhì)量。



總結(jié):讓 Agent Memory 學(xué)會 “按需計(jì)算”

BudgetMem 的核心觀點(diǎn)是:未來的 Agent Memory 不應(yīng)只是固定地存儲、檢索和壓縮歷史,而應(yīng)根據(jù)當(dāng)前 query 的需求,動態(tài)決定投入多少計(jì)算來提取和組織記憶。

對于簡單 query,系統(tǒng)可以走低成本路徑快速處理;對于復(fù)雜 query,則可以主動調(diào)用更強(qiáng)模塊、更深推理或更大模型,獲得更可靠的記憶支持。

因此,BudgetMem 希望推動 Agent Memory 從 “固定流程” 走向 “按需計(jì)算”:讓記憶系統(tǒng)不只是會記住歷史,還能判斷什么時候該 “快速掃一眼”,什么時候該 “認(rèn)真回看”、整理證據(jù)并投入更多計(jì)算。這種能力也將成為長期對話、個性化智能體和真實(shí)部署場景中的關(guān)鍵基礎(chǔ)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
定了!國際刑事法院宣判:菲律賓前總統(tǒng)被判“反人類罪”!

定了!國際刑事法院宣判:菲律賓前總統(tǒng)被判“反人類罪”!

空樽對月花獨(dú)瘦
2026-04-27 21:09:43
FIFA官宣!馬寧終于圓夢 首次執(zhí)法世界杯 最新收入曝光:保底49萬

FIFA官宣!馬寧終于圓夢 首次執(zhí)法世界杯 最新收入曝光:保底49萬

侃球熊弟
2026-06-18 04:11:06
晚飯七分飽被推翻了?醫(yī)生:過了65歲,吃飯盡量要做到這5點(diǎn)

晚飯七分飽被推翻了?醫(yī)生:過了65歲,吃飯盡量要做到這5點(diǎn)

健康科普365
2026-06-14 18:10:08
19歲國乒天才徹底爆發(fā)!連續(xù)擊敗世界名將,張本智和都看傻了

19歲國乒天才徹底爆發(fā)!連續(xù)擊敗世界名將,張本智和都看傻了

等等talk
2026-05-30 14:40:30
皇馬第三簽正式官宣!穆帥認(rèn)可后防統(tǒng)帥,姆巴佩親自說服加入

皇馬第三簽正式官宣!穆帥認(rèn)可后防統(tǒng)帥,姆巴佩親自說服加入

林子說事
2026-06-18 19:00:25
妻子出軌,丈夫?qū)?5公分蠟燭塞進(jìn)妻子的陰道內(nèi)

妻子出軌,丈夫?qū)?5公分蠟燭塞進(jìn)妻子的陰道內(nèi)

胖胖侃咖
2025-04-13 08:00:08
烏軍陣地冒出百名俄兵,前線重鎮(zhèn)一夜陷落,澤連斯基求饒?zhí)t了

烏軍陣地冒出百名俄兵,前線重鎮(zhèn)一夜陷落,澤連斯基求饒?zhí)t了

軍軍記錄生活
2026-06-17 21:41:28
蘇州至上海增開C字頭城際列車

蘇州至上海增開C字頭城際列車

姑蘇網(wǎng)
2026-06-18 10:47:46
1979 年越軍山洞被灌炸藥汽油,僅一人逃生,報(bào)出數(shù)字令眾人沉默

1979 年越軍山洞被灌炸藥汽油,僅一人逃生,報(bào)出數(shù)字令眾人沉默

磊子講史
2026-03-24 18:52:21
沖田杏梨ブランド復(fù)活!什么意思?

沖田杏梨ブランド復(fù)活!什么意思?

孤獨(dú)的獨(dú)角獸影視
2026-06-18 09:20:13
特朗普:只要不招惹中國,那就沒一個能打,我想打誰就打誰

特朗普:只要不招惹中國,那就沒一個能打,我想打誰就打誰

怪味歷史連連看
2026-06-17 14:53:20
王毅離開48小時,蒙古國突然行動!暗號直指東京,背后大有文章

王毅離開48小時,蒙古國突然行動!暗號直指東京,背后大有文章

清歡百味
2026-06-18 14:42:42
與馬蓉離婚9年后,42歲王寶強(qiáng)宣布喜訊,原來他和賈玲是同類人

與馬蓉離婚9年后,42歲王寶強(qiáng)宣布喜訊,原來他和賈玲是同類人

洲洲影視娛評
2026-06-17 23:21:11
女子高鐵聽鄰座女孩和男友打電話,她懵了:聲音和她丈夫絲毫不差

女子高鐵聽鄰座女孩和男友打電話,她懵了:聲音和她丈夫絲毫不差

林林故事揭秘
2025-04-28 13:25:19
鄭麗文表態(tài)不支持統(tǒng)一?她是“女版馬英九”?我們不要誤會她

鄭麗文表態(tài)不支持統(tǒng)一?她是“女版馬英九”?我們不要誤會她

阿離家居
2026-06-19 00:50:34
韓耀東已任青島市委常委、市政府黨組副書記

韓耀東已任青島市委常委、市政府黨組副書記

黃河新聞網(wǎng)呂梁
2026-06-18 15:42:59
比大熊貓還稀少!黃巖島發(fā)現(xiàn)50多只瀕危國寶,背后原因讓人激動

比大熊貓還稀少!黃巖島發(fā)現(xiàn)50多只瀕危國寶,背后原因讓人激動

萬象硬核本尊
2026-06-18 14:57:40
我國最“不靠譜”的三位專家,公開在央視“忽悠”人,卻爆火多年

我國最“不靠譜”的三位專家,公開在央視“忽悠”人,卻爆火多年

混沌錄
2026-06-18 19:03:29
4套房全給兒子,拎包去女兒家住,女兒堵門塞回機(jī)票:我們下周走

4套房全給兒子,拎包去女兒家住,女兒堵門塞回機(jī)票:我們下周走

墨染塵香
2026-06-16 09:15:36
正式確定!國安助教加盟遼寧鐵人,再度攜手徐正源,夏窗引援生變

正式確定!國安助教加盟遼寧鐵人,再度攜手徐正源,夏窗引援生變

體壇鑒春秋
2026-06-18 12:13:27
2026-06-19 05:40:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
13299文章數(shù) 142673關(guān)注度
往期回顧 全部

科技要聞

庫克承認(rèn)扛不住了,蘋果漲價(jià)“不可避免”

頭條要聞

瑞士4-1波黑獲小組賽首勝 曼贊比替補(bǔ)登場進(jìn)兩球

頭條要聞

瑞士4-1波黑獲小組賽首勝 曼贊比替補(bǔ)登場進(jìn)兩球

體育要聞

英格蘭不再九子奪嫡,凱恩才是唯一真神

娛樂要聞

39歲梅西不愧是人生贏家!

財(cái)經(jīng)要聞

博??礗PO,賺錢業(yè)務(wù)與資本敘事是兩門生意

汽車要聞

驚出冷汗!重慶實(shí)測奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

本地
時尚
教育
旅游
公開課

本地新聞

世界杯黑馬佛得角:河北人開超市,溫州人當(dāng)老板

看不懂球,還看不懂帥哥嗎?

教育要聞

畢業(yè)即高薪!高考生緊盯這6個專業(yè),畢業(yè)后50%能到國企就業(yè)!

旅游要聞

古樹公園“重生記”,曲靖城郊多了個“漫時光”秘境

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版