免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

讓 Agent 真正協(xié)同作戰(zhàn):GoS 為多智能體推理構(gòu)建共享信念狀態(tài)

0
分享至



近年來,大語言模型在數(shù)學(xué)、代碼等任務(wù)上的表現(xiàn)不斷刷新上限,但到了醫(yī)療診斷、故障排查這類真實(shí)世界任務(wù)里,真正困難的是讓多個(gè)智能體在不確定的動(dòng)態(tài)環(huán)境中持續(xù)協(xié)作推理。

以醫(yī)療診斷為例,主治醫(yī)生不可能一開始就讓病人把所有檢查都做一遍,而是要根據(jù)當(dāng)前診斷方向,動(dòng)態(tài)安排影像科、檢驗(yàn)科等不同科室逐步開展檢查、持續(xù)補(bǔ)充證據(jù),并在過程中不斷修正判斷。

相比之下,現(xiàn)有多智能體推理方法雖然看起來做了分工,但常常要么停留在簡單串聯(lián)多個(gè)智能體的層面,只是把前一個(gè)智能體的輸出交給下一個(gè)繼續(xù)處理;要么默認(rèn)所有證據(jù)都已經(jīng)提前備好,缺乏真正的自主調(diào)查和動(dòng)態(tài)決策能力。

論文指出,也正因如此,現(xiàn)有 CoT、ToT、GoT、FoT 等推理框架在遷移到醫(yī)療診斷、分布式系統(tǒng)故障排查等場景時(shí),往往會(huì)進(jìn)一步暴露出四類失敗模式:證據(jù)偽造、上下文漂移、回溯失敗和過早停止。



圖 1: 傳統(tǒng)推理框架在溯因任務(wù)中的四類典型問題

這些失敗并不是偶然現(xiàn)象,而是來自兩個(gè)結(jié)構(gòu)性缺陷:

  1. 很多現(xiàn)有方法把假設(shè)、證據(jù)和推理進(jìn)展混在非結(jié)構(gòu)化自然語言上下文里,缺乏顯式狀態(tài)表示;
  2. 缺少狀態(tài)控制機(jī)制,使得智能體是否選擇回溯、下鉆、終止,幾乎都只能靠自由發(fā)揮。

因此,在長程推理過程中,智能體往往難以穩(wěn)定維護(hù)推理狀態(tài),容易偏離正確方向,或過早停留在表層結(jié)論。

南開大學(xué)研究團(tuán)隊(duì)和聯(lián)想合作提出了Graph of States(GoS),一個(gè)面向通用溯因推理任務(wù)的神經(jīng)符號框架,其核心目標(biāo)是為溯因任務(wù)顯式構(gòu)建一個(gè)可維護(hù)、可回退、可收斂的推理狀態(tài)空間,把原本隱式、松散的推理過程,轉(zhuǎn)化為受約束的有向搜索。該工作已被 ICML 2026 正式接收。



  • 論文標(biāo)題: Graph of States: Solving Abductive Tasks with Large Language Models
  • 論文鏈接:https://arxiv.org/pdf/2603.21250
  • 代碼地址: https://github.com/gaorch85/Graph-of-States

目前,xCloud 聯(lián)想智能云正加速將 GoS 技術(shù)融入其智能運(yùn)維產(chǎn)品體系,助力企業(yè)構(gòu)建零故障、自愈合、業(yè)務(wù)感知的智能運(yùn)維體系。

01 GoS:給推理加上 “顯式信念狀態(tài)”

GoS 的核心思想,是把多智能體協(xié)作與顯式信念狀態(tài)建模結(jié)合起來。整個(gè)系統(tǒng)分為兩層:上層是認(rèn)知層,負(fù)責(zé)具體領(lǐng)域內(nèi)的多智能體協(xié)作;下層是符號層,負(fù)責(zé)維護(hù)結(jié)構(gòu)化推理狀態(tài),并對過程進(jìn)行導(dǎo)航和約束。

在認(rèn)知層中,GoS 不再采用零散的功能原子,而是讓中心智能體和專家智能體分別對應(yīng)現(xiàn)實(shí)世界中的專業(yè)角色。比如在醫(yī)療場景中,可以對應(yīng)主治醫(yī)生、影像科醫(yī)生、病理科醫(yī)生;在分布式系統(tǒng)場景中,則對應(yīng)應(yīng)用運(yùn)維、Linux 運(yùn)維、網(wǎng)絡(luò)運(yùn)維和數(shù)據(jù)庫運(yùn)維。這樣做的目的,是讓推理流程更貼近真實(shí)世界中的協(xié)作分工,也更便于人理解和審查其推理過程。



圖 2: GoS 總體框架:雙層神經(jīng)符號架構(gòu)與整體推理流程

GoS 最關(guān)鍵的部分是符號層。它不再把調(diào)查過程隱藏在非結(jié)構(gòu)化歷史對話里,而是顯式維護(hù)一個(gè)由因果圖和狀態(tài)機(jī)組成的信念狀態(tài)。前者記錄癥狀、證據(jù)、假設(shè)及其支持、反駁和細(xì)化關(guān)系;后者控制當(dāng)前推理層級,決定系統(tǒng)是繼續(xù)搜集證據(jù)、向更細(xì)粒度下鉆,還是在出現(xiàn)沖突證據(jù)時(shí)回退到更早層重新判斷。

與此同時(shí),GoS 還引入了一個(gè)很關(guān)鍵的機(jī)制:推理焦點(diǎn)(reasoning focus)。系統(tǒng)在每一步都不會(huì)平均地看待所有可能方向,而是聚焦當(dāng)前層級中置信度最高的假設(shè),把調(diào)查預(yù)算和推理資源集中到最值得追蹤的分支上。這樣做有利于把原本容易發(fā)散的探索,變成更像 “有導(dǎo)航的調(diào)查”。

02 雙層閉環(huán):從推理焦點(diǎn)到證據(jù)更新

GoS 的推理過程不是簡單的‘先計(jì)劃、再執(zhí)行’,而是一個(gè)持續(xù)循環(huán)的雙向閉環(huán)。首先,符號層會(huì)根據(jù)當(dāng)前信念狀態(tài)找到推理焦點(diǎn),并將其轉(zhuǎn)化為對認(rèn)知層的調(diào)查指令;隨后,認(rèn)知層調(diào)用工具、獲取證據(jù)并完成分析,再將結(jié)果返回給符號層,用于更新因果圖、重新校準(zhǔn)假設(shè)置信度,并觸發(fā)下一輪狀態(tài)轉(zhuǎn)換。

這一閉環(huán)使多智能體協(xié)作不再是無約束的自由發(fā)揮,而是始終圍繞當(dāng)前最有價(jià)值的假設(shè)前進(jìn);新獲得的證據(jù)也不再只是停留在文本里,而會(huì)成為后續(xù)推理的依據(jù)。



圖 3: 雙向神經(jīng) - 符號交互:從推理焦點(diǎn)引導(dǎo)調(diào)查,到新證據(jù)反向更新信念狀態(tài)

03 關(guān)鍵機(jī)制:該回溯時(shí)回溯,該下鉆時(shí)下鉆

對于溯因任務(wù)來說,真正困難的往往不是 “生成一個(gè)答案”,而是在推理過程中根據(jù)證據(jù)變化,按規(guī)則決定狀態(tài)轉(zhuǎn)移。為此,GoS 設(shè)計(jì)了兩類核心狀態(tài)轉(zhuǎn)換機(jī)制:Backtracking和Drill-Down。

不同于把這些決策完全交給智能體自由發(fā)揮,GoS 為狀態(tài)演化引入了清晰的轉(zhuǎn)移規(guī)則。具體來說,當(dāng)當(dāng)前推理路徑上的某個(gè)上層祖先假設(shè)在置信度重估后不再是該層最優(yōu)候選時(shí),系統(tǒng)會(huì)回退到對應(yīng)層級并剪除建立在錯(cuò)誤前提上的后續(xù)分支;而下鉆也不是 “覺得差不多了就繼續(xù)往下想”,而是只有當(dāng)當(dāng)前最優(yōu)假設(shè)同時(shí)滿足足夠的置信度優(yōu)勢和足夠的支持證據(jù)數(shù)量時(shí),系統(tǒng)才會(huì)進(jìn)一步細(xì)化到更具體的子假設(shè)。正是這種帶有明確約束的狀態(tài)控制,使 GoS 在面對非單調(diào)、動(dòng)態(tài)演化的信息時(shí),不再只是生成連貫文本,而是能夠以更穩(wěn)定、更可控的方式逐步逼近真正可執(zhí)行的根因。



圖 4: 狀態(tài)轉(zhuǎn)換:回溯(Backtracking)與下鉆(Drill-Down)

04 實(shí)驗(yàn):在兩個(gè)高風(fēng)險(xiǎn)真實(shí)場景中驗(yàn)證 GoS

為了驗(yàn)證 GoS 的有效性和通用性,論文選擇了兩個(gè)非常具有現(xiàn)實(shí)意義的溯因場景:醫(yī)療診斷和分布式系統(tǒng)故障診斷。在醫(yī)療診斷任務(wù)中,作者基于 DiagnosisArena 基準(zhǔn)做了一個(gè)關(guān)鍵改造:不再一開始就提供完整輔助檢查結(jié)果,而是只給病人主訴和基礎(chǔ)體格檢查,讓智能體像真實(shí)醫(yī)生一樣主動(dòng)申請檢查、逐步獲取外部信息,再完成診斷,從而恢復(fù) “主動(dòng)取證、動(dòng)態(tài)推理” 的溯因本質(zhì)。在這一任務(wù)上,GoS 在 Human-as-a-Judge 評估下取得了39.86% 的 Match和78.99% 的 Relevant,明顯優(yōu)于所有基線方法,并在更低成本下實(shí)現(xiàn)了更好的結(jié)果。

在分布式系統(tǒng)故障診斷任務(wù)中,論文基于真實(shí)生產(chǎn)環(huán)境構(gòu)建了 150 個(gè) incident,要求智能體從初始告警出發(fā),主動(dòng)查詢?nèi)罩尽⒅笜?biāo)和 shell 輸出,逐步恢復(fù)故障上下文并定位 root cause。實(shí)驗(yàn)結(jié)果顯示,GoS 取得了70.67% 的 Match和88.00% 的 Relevant,其中 Match 比最強(qiáng)基線高出36.67 個(gè)百分點(diǎn)。這說明,很多方法雖然能判斷 “問題大概在哪個(gè)方向”,因此 Relevant 并不低,但要進(jìn)一步收斂到真正可執(zhí)行的細(xì)粒度根因,仍然需要持續(xù)調(diào)查、狀態(tài)控制和層級下鉆,而這正是 GoS 的優(yōu)勢。



表 1: 醫(yī)療診斷結(jié)果:GoS 在 Match 與 Relevant 上均優(yōu)于所有基線



表 2: 分布式系統(tǒng)故障診斷結(jié)果:GoS 顯著提升細(xì)粒度根因定位能力

作者還進(jìn)一步進(jìn)行了較為全面的消融實(shí)驗(yàn)與參數(shù)敏感性分析。結(jié)果表明,GoS 的性能提升并非來自某個(gè)偶然技巧,而是確實(shí)依賴于推理焦點(diǎn)、因果圖和狀態(tài)機(jī)等關(guān)鍵模塊的協(xié)同作用;同時(shí),隨著神經(jīng)符號交互輪數(shù)、檢索預(yù)算以及狀態(tài)轉(zhuǎn)移閾值的變化,GoS 也表現(xiàn)出清晰且可解釋的性能趨勢,說明該框架不僅有效,而且具備較好的穩(wěn)定性與可控性。



表 3: 消融實(shí)驗(yàn):顯式因果圖、狀態(tài)機(jī)與推理焦點(diǎn)缺一不可



圖 5: 敏感性分析:GoS 在不同預(yù)算和閾值配置下的性能變化

05 意義:從垂直場景方法走向通用推理框架

從更大的角度看,GoS 的意義不只是把醫(yī)療和 AIOps 兩個(gè)任務(wù)做得更好,而是向前推進(jìn)了一個(gè)更根本的問題:對于真實(shí)世界中的高風(fēng)險(xiǎn)任務(wù),智能體需要的并不只是更多知識(shí)、更多工具、更多上下文,還需要能在不完整信息下顯式維護(hù)信念狀態(tài),處理沖突證據(jù),在必要時(shí)回溯,在合適時(shí)下鉆,最終把搜索過程穩(wěn)定地導(dǎo)向真實(shí)根因。從這個(gè)角度看,GoS 所面向的其實(shí)也是當(dāng)前智能體研究中非常關(guān)鍵的一類問題,即long-horizon reasoning與multi-turn interaction:智能體不只是回答一次,而是要在持續(xù)調(diào)查和多輪交互中保持狀態(tài)一致,并逐步收斂。

論文也指出,GoS 并不排斥已有的領(lǐng)域特化方法,反而與它們互補(bǔ)。無論是醫(yī)療中的高質(zhì)量知識(shí)庫和 RAG,還是 AIOps 中的多模態(tài)預(yù)處理和 SOP 檢索,都可以與 GoS 結(jié)合,提升其在垂直場景中的搜索效率和決策可靠性。換句話說,GoS 提供的不是某一個(gè)專用智能體,而是一套面向溯因推理、也面向智能體長程推理的通用推理骨架。

作者簡介


本文第一作者為羅宇,南開大學(xué)智能運(yùn)維課題組博士一年級,主要研究方向?yàn)橹悄荏w長程推理、自進(jìn)化智能體和根因分析。本文通訊作者為南開大學(xué)軟件學(xué)院副教授、博士生導(dǎo)師孫永謙。他長期深耕智能運(yùn)維(AIOps)領(lǐng)域,聚焦云原生、數(shù)據(jù)中心、超算、智算等領(lǐng)域的故障機(jī)理研究,同時(shí)致力于多智能體協(xié)作與大模型推理優(yōu)化等前沿方向,持續(xù)推動(dòng)面向復(fù)雜系統(tǒng)的智能決策研究。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
小馬云要當(dāng)爸爸了,女友自曝懷孕兩個(gè)月:小馬云首場直播打賞29萬

小馬云要當(dāng)爸爸了,女友自曝懷孕兩個(gè)月:小馬云首場直播打賞29萬

漢史趣聞
2026-06-19 19:46:44
1夜6大轉(zhuǎn)會(huì)!馬丁內(nèi)斯決定離任,利物浦截胡熱刺簽下穆尼奧斯!

1夜6大轉(zhuǎn)會(huì)!馬丁內(nèi)斯決定離任,利物浦截胡熱刺簽下穆尼奧斯!

田先生籃球
2026-06-19 07:58:51
日本球迷賽后討論,中國只有2位球員,具備踢世界杯的資格

日本球迷賽后討論,中國只有2位球員,具備踢世界杯的資格

體壇狗哥
2026-06-19 15:58:18
FIFA:因科內(nèi)重傷世界杯報(bào)銷,薩索洛可獲最高750萬歐元補(bǔ)償

FIFA:因科內(nèi)重傷世界杯報(bào)銷,薩索洛可獲最高750萬歐元補(bǔ)償

懂球帝
2026-06-19 11:03:12
河南26歲帥哥時(shí)穎去世,結(jié)婚僅半年,妻子顏值高,悲痛透露原因

河南26歲帥哥時(shí)穎去世,結(jié)婚僅半年,妻子顏值高,悲痛透露原因

180視角
2026-06-19 12:33:45
凌晨直線跳水!航天大牛股爆出重磅利空,單日大跌超10%

凌晨直線跳水!航天大牛股爆出重磅利空,單日大跌超10%

魏家東
2026-06-19 14:22:38
日媒:中國方面似乎在慢慢重啟赴日團(tuán)體旅游項(xiàng)目

日媒:中國方面似乎在慢慢重啟赴日團(tuán)體旅游項(xiàng)目

隨波蕩漾的漂流瓶
2026-06-19 17:09:56
張維為又出來語出驚人了!

張維為又出來語出驚人了!

胖胖說他不胖
2026-06-19 17:20:55
上海交大:骨質(zhì)疏松的人,需要的不是鈣片,而是每天堅(jiān)持這8習(xí)慣

上海交大:骨質(zhì)疏松的人,需要的不是鈣片,而是每天堅(jiān)持這8習(xí)慣

路醫(yī)生健康科普
2026-06-19 17:05:03
墨西哥主帥:與韓國的比賽很艱苦;我不喜歡李剛?cè)实陌l(fā)色

墨西哥主帥:與韓國的比賽很艱苦;我不喜歡李剛?cè)实陌l(fā)色

懂球帝
2026-06-19 15:53:25
別再不舍得開空調(diào)!Nature重磅研究:空調(diào)設(shè)定對溫度 抑制多種癌生長

別再不舍得開空調(diào)!Nature重磅研究:空調(diào)設(shè)定對溫度 抑制多種癌生長

鳳凰衛(wèi)視
2026-06-16 14:46:48
沉默45年,中國第二輪"嚴(yán)打"終于來了!目標(biāo)改變總體戰(zhàn)正式打響

沉默45年,中國第二輪"嚴(yán)打"終于來了!目標(biāo)改變總體戰(zhàn)正式打響

細(xì)說職場
2026-06-19 14:29:16
多給一天時(shí)間?伊朗隊(duì)請求再次被拒,美國:比賽當(dāng)天必須離開

多給一天時(shí)間?伊朗隊(duì)請求再次被拒,美國:比賽當(dāng)天必須離開

全景體育V
2026-06-19 18:10:55
警惕!A股徹底變天!國家戰(zhàn)略大洗牌,未來主線徹底明朗

警惕!A股徹底變天!國家戰(zhàn)略大洗牌,未來主線徹底明朗

新浪財(cái)經(jīng)
2026-06-19 11:12:55
"女吃播三巨頭"現(xiàn)狀:臉像骷髏、切除味覺神經(jīng),有人遺囑曾立好

"女吃播三巨頭"現(xiàn)狀:臉像骷髏、切除味覺神經(jīng),有人遺囑曾立好

地球記
2026-06-19 06:05:05
湖南一射擊俱樂部發(fā)布1人死亡調(diào)查報(bào)告:劉某在取戴耳機(jī)時(shí)槍支脫手走火,擊中杜某的頭部,致杜某顱腦損傷

湖南一射擊俱樂部發(fā)布1人死亡調(diào)查報(bào)告:劉某在取戴耳機(jī)時(shí)槍支脫手走火,擊中杜某的頭部,致杜某顱腦損傷

大象新聞
2026-06-18 12:45:24
浙江杭州一攝影師拍下游客偷拿靈隱寺“祈福錢”,景區(qū)回應(yīng):這種情況發(fā)現(xiàn)后會(huì)報(bào)警處理,看到可聯(lián)系工作人員

浙江杭州一攝影師拍下游客偷拿靈隱寺“祈福錢”,景區(qū)回應(yīng):這種情況發(fā)現(xiàn)后會(huì)報(bào)警處理,看到可聯(lián)系工作人員

大風(fēng)新聞
2026-06-19 19:09:03
美伊?xí)勅∠?,此前表達(dá)強(qiáng)烈不滿的以色列被萬斯喊話“只有總統(tǒng)特朗普還同情你們”

美伊?xí)勅∠?,此前表達(dá)強(qiáng)烈不滿的以色列被萬斯喊話“只有總統(tǒng)特朗普還同情你們”

新民周刊
2026-06-19 22:45:36
歷史要?dú)в谝坏??蒙古國,正在把中?0年的努力毀掉!

歷史要?dú)в谝坏??蒙古國,正在把中?0年的努力毀掉!

李云飛Afey
2026-06-18 19:47:26
徹底沒了!八家知名汽車品牌被永久凍結(jié)車輛生產(chǎn)資質(zhì)

徹底沒了!八家知名汽車品牌被永久凍結(jié)車輛生產(chǎn)資質(zhì)

XCiOS俱樂部
2026-06-17 20:43:42
2026-06-20 01:48:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
13299文章數(shù) 142674關(guān)注度
往期回顧 全部

科技要聞

Anthropic被禁,智譜卻漲瘋了

頭條要聞

特朗普:伊朗走投無路徹底完蛋了 我們就把這60天耗完

頭條要聞

特朗普:伊朗走投無路徹底完蛋了 我們就把這60天耗完

體育要聞

世界杯最不知名球員,沒上場先漲粉600萬

娛樂要聞

孫藝珍曬母子合照!4歲小甜豆暴風(fēng)成長

財(cái)經(jīng)要聞

Token低價(jià)陷阱

汽車要聞

驚出冷汗!重慶實(shí)測奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

游戲
藝術(shù)
親子
時(shí)尚
公開課

任天堂完全獨(dú)占新游開預(yù)購!7月23日發(fā)售 女主好性感

藝術(shù)要聞

放大100倍都不怕!這位“人肉打印機(jī)”畫家,把絲綢畫出了呼吸感

親子要聞

媽媽玩手機(jī)累了吧

夏天上衣穿短不穿長,看看下面這幾款短上衣,顯高舒適顯比例

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版