免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

MLIPs 邁入自主設(shè)計與演化時代

0
分享至

MLIPs 邁入自主設(shè)計與演化時代

AutoResearch-MLIP:讓每一個假設(shè)、每一次失敗,都成為下一輪研究的依據(jù)

Paper: Agentic, autonomous design evolution of machine-learned interatomic potentials

文章預(yù)?。?/strong>https://chemrxiv.org/doi/full/10.26434/chemrxiv.15003852/v1

代碼開源:https://github.com/pic-ai-robotic-chemistry/Agentic-auto-designed-MLIPs

一句話概括:AutoResearch-MLIP 以機器學(xué)習(xí)力場為研究對象,構(gòu)建了一套自主科研閉環(huán)——智能體持續(xù)提出設(shè)計假設(shè)、修改代碼、運行評估、記錄失敗,并以此指導(dǎo)下一步,整個演化過程有據(jù)可查、可以回溯。

自主科研的關(guān)鍵:讓每一步都留下可追溯的記錄

已有的科研智能體工作大多聚焦在工具調(diào)用、代碼生成和自動運行實驗上。AutoResearch-MLIP 關(guān)注的是更進一步的問題:智能體能否形成真正意義上的研究過程——持續(xù)提出假設(shè)、修改代碼、運行評估、讀取結(jié)果、記錄失敗,并把這些記錄帶入下一輪?

評價這類系統(tǒng),不能只看最終模型的分?jǐn)?shù)。一個高分候選可能來自偶然的搜索;一次暫時的失敗,往往反而為下一輪嘗試提供靈感。真正需要檢查的是完整的研究過程:每個想法怎么落到代碼,評估結(jié)果如何影響了后續(xù)決策,哪些失敗被記錄,又改變了什么。

為什么選 MLIP 作為試驗場

機器學(xué)習(xí)原子間勢(machine-learned interatomic potentials,MLIPs)是一個理想的測試對象。一個 MLIP 由多個可以獨立實現(xiàn)、組合和繼承的設(shè)計模塊構(gòu)成——包括局域相互作用、讀出層與組成建模、特征表示方式、長程能量項、周期圖構(gòu)造和訓(xùn)練目標(biāo)。

這些模塊不僅可以寫成代碼,還可以在分子動力學(xué)和周期性晶體任務(wù)上被定量評估。MLIP 開發(fā)天然對應(yīng)一個"提出假設(shè) → 實現(xiàn)代碼 → 評估結(jié)果 → 繼承或放棄"的研究循環(huán),是檢驗自主科研系統(tǒng)能否產(chǎn)生可追溯設(shè)計演化的合適試驗場。

系統(tǒng)設(shè)計:讓每個候選都來自受控的代碼修改

AutoResearch-MLIP 的運行依托一套預(yù)定義的技能約束框架(skill-programmed harness),明確規(guī)定智能體的操作范圍和行為邊界。其中,MLIP-Evidence 負(fù)責(zé)將論文、代碼倉庫和代碼分析轉(zhuǎn)化為結(jié)構(gòu)化的設(shè)計證據(jù);MLIP-Autoresearch 負(fù)責(zé)試驗調(diào)度、評估對接、錯誤修復(fù)和繼續(xù)決策。關(guān)鍵約束是:智能體只能修改候選 MLIP 的代碼,不能更改評估器、數(shù)據(jù)劃分或指標(biāo)定義。

這套機制的核心作用是把"生成一個候選想法"變成"完成一次受控評估"。每個候選必須先被實現(xiàn)為代碼修改,通過固定評估器,得到明確的結(jié)果記錄,才進入繼承、延遲或拒絕的后續(xù)流程——這是它進入可追溯研究軌跡的前提。


圖 1|AutoResearch-MLIP 的基本流程。左側(cè)是傳統(tǒng)的一次性候選生成流程;右側(cè)是 AutoResearch-MLIP:設(shè)計樹、證據(jù)與失敗記錄、評估規(guī)則共同約束智能體的全部操作,構(gòu)成有邊界的自主科研運行框架。

從一個近零 MLP 出發(fā):40 代、280 個候選

實驗從一個刻意設(shè)計得很弱的初始模型出發(fā)——基于原子間距的近零 MLP,可以運行、可以微分,同時作為整個演化過程的評分基準(zhǔn)。

此后進行了 40 代演化,每代提出 10 個方向,通常選擇 8 個候選實現(xiàn)并評估,共積累 280 個已評估候選。圖 2 展示了整體演化軌跡:灰點是每代所有已評估候選,藍線是每代最高分候選,橙線是實際被選為下一輪起點的候選。

兩條線并不總是重合——這正是 AutoResearch-MLIP 的核心設(shè)計之一:最高分候選和研究延續(xù)方向是兩個獨立的決策。前者作為證據(jù)保留,后者可以選擇分?jǐn)?shù)較低但借鑒意義更強的分支繼續(xù)展開。


圖 2|40 代評估軌跡。藍線為每代最高分候選,橙線為實際選為下一輪起點的候選;虛線標(biāo)出周期材料評估模塊加入的位置。

設(shè)計模塊在代際傳承中逐步積累

圖 3 展示的不是分?jǐn)?shù),而是被選為延續(xù)起點的代碼中實際保留了哪些設(shè)計模塊。

演化路徑從初始 pair-distance MLP 出發(fā),依次加入局域消息傳遞、讀出層與組成建模、角度/高階/張量特征、長程能量項,最后在周期性晶體訓(xùn)練階段引入包含鏡像偏移信息的周期性結(jié)構(gòu)。藍色方塊標(biāo)注某個模塊首次加入或發(fā)生實質(zhì)變化的位置;淺色單元表示該模塊在后續(xù)延續(xù)起點的代碼中被繼續(xù)保留。

設(shè)計元素的積累不是線性的——高分候選可以留存為證據(jù),而延續(xù)方向未必是當(dāng)前最高分的那條分支。


圖 3|被選為下一輪起點的代碼中實際攜帶的模型組件。淺色單元為被繼承的模塊,藍色方塊為新增或有實質(zhì)改動的模塊。

失敗不只是低分——它是下一步的邊界

AutoResearch-MLIP 中,失敗不等于低分,而是一類包含約束信息的結(jié)果記錄。每次失敗、對照實驗或局部改進,都會被明確標(biāo)注,并限制下一輪探索可以嘗試什么、需要繞開什么。

幾個典型例子:早期部分生成分支劣于保留的父代候選;中期某些單一模塊的改進沒能提升總分;周期材料階段,單純調(diào)整訓(xùn)練日程、截斷半徑或殘差尾項,均無法讓分子模型遷移到周期材料。這些失敗記錄進入系統(tǒng)記憶,直接改變了后續(xù)的搜索方向。

正因如此,系統(tǒng)采用非貪心延續(xù)策略:高分候選留存為證據(jù),實際展開的分支可以是分?jǐn)?shù)更低但研究價值更高的方向。

周期材料階段:驗證實現(xiàn)路徑,而非重新發(fā)現(xiàn)物理規(guī)律

周期邊界條件本身不是新知識。這一階段真正要檢驗的是:從分子任務(wù)演化出來的模型,是否把晶胞和周期鏡像信息正確傳入了圖結(jié)構(gòu)。

G026 到 G034 的系列嘗試均未產(chǎn)生穩(wěn)定的周期性信號——調(diào)整訓(xùn)練參數(shù)、截斷平滑和殘差項都不奏效。G035 的圖修復(fù)改變了圖的構(gòu)造方式:將周期鏡像作為獨立鄰邊保留,并讓鏡像偏移信息參與消息傳遞。修復(fù)后,周期性材料相關(guān)的指標(biāo)出現(xiàn)明顯躍升。

隨后,系統(tǒng)并未把 G038 的高分直接視為原因明確的進步。G039 批次的所有子代均未超過 G038,對照重訓(xùn)的得分也有所下降。系統(tǒng)因此保留 G038 作為當(dāng)前最優(yōu)證據(jù),同時選擇分?jǐn)?shù)略低但歸因更清晰的 G039 分支繼續(xù)展開。G040 從這一分支出發(fā),最終達到當(dāng)前評估下的新前沿。


圖 4|周期圖修復(fù)與歸因驗證后的性能恢復(fù)。上圖展示 G035 之后周期材料指標(biāo)的躍升;下圖展示 G039 歸因驗證如何將證據(jù)保留與延續(xù)方向的選擇分開處理。

外部基準(zhǔn):演化結(jié)果不只適用于內(nèi)部評估

內(nèi)部評估器僅用于指導(dǎo)演化方向,不代表通用性。為此,研究對第 40 代候選進行了獨立的外部驗證,與 NequIP、Allegro、CHGNet、MatGL-M3GNet 在相同短訓(xùn)練條件下進行對比,且外部基準(zhǔn)的結(jié)果未參與任何延續(xù)決策。

在 MD22(大分子動力學(xué)遷移性測試)上,最終候選的能量誤差接近 NequIP,力誤差低于 NequIP 和 Allegro。在 Sub-OMat24(周期結(jié)構(gòu)外部子集)上,力誤差優(yōu)于所有對比基線,但能量校準(zhǔn)不如專為材料預(yù)訓(xùn)練設(shè)計的 MatGL-M3GNet——這在預(yù)期之內(nèi)。

AutoResearch-MLIP 不聲稱演化出了通用勢函數(shù)。這組結(jié)果說明的是:通過連續(xù)演化得到的候選,在不針對外部基準(zhǔn)做優(yōu)化的前提下,也能在多項外部指標(biāo)上表現(xiàn)出競爭力。


圖 5|外部基準(zhǔn)對比。紅色為 AutoResearch-MLIP 最終候選(第 40 代),灰色為外部基線;結(jié)果均基于相同短訓(xùn)練協(xié)議。

下一步:從分?jǐn)?shù)優(yōu)化到表征演化

目前的評估器以能量誤差和力誤差為核心。一個自然的下一步是把評估目標(biāo)推進到表征層:不只是讓模型在某個基準(zhǔn)上得分更高,而是演化出更可復(fù)用、更具可解釋性的內(nèi)部表示。

近期關(guān)于 MLIP 表征空間的研究發(fā)現(xiàn),不同架構(gòu)的模型在經(jīng)過錨點投影后,原子環(huán)境在隱空間呈現(xiàn)出相近的幾何結(jié)構(gòu)。這提示未來的評估器可以進一步納入跨模型的表征對齊、結(jié)構(gòu)不變性的診斷信號。

如果這一方向走通,AutoResearch-MLIP 的自主演化循環(huán)就不再只是搜索高分模型,而是朝著科學(xué)上更可復(fù)用、更可遷移的設(shè)計原則推進。

總結(jié)

AutoResearch-MLIP 在機器學(xué)習(xí)力場這一真實科學(xué)建模問題上,構(gòu)建了一套有跡可循的自主演化研究框架:智能體在固定評估規(guī)則下,將假設(shè)提出、代碼實現(xiàn)、結(jié)果評估、失敗記錄和分支決策,連接成一套完整、可回溯的研究過程。

AutoResearch-MLIP 由中國科大機器化學(xué)家團隊與華為 MindSpore Science 團隊聯(lián)合開發(fā),已可通過"靈境造物"科研平臺使用。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
記者:斯普利特公牛年薪約700萬美元,遠高于開拓者開的100萬

記者:斯普利特公牛年薪約700萬美元,遠高于開拓者開的100萬

懂球帝
2026-06-19 09:50:09
我國人均GDP已超1.3萬美元,將跨入高收入國家陣營!

我國人均GDP已超1.3萬美元,將跨入高收入國家陣營!

聞號說經(jīng)濟
2026-05-19 09:29:27
43年周恩來被邀吃飯,看到桌上面條:吃面哪天都行,就3月5日不行

43年周恩來被邀吃飯,看到桌上面條:吃面哪天都行,就3月5日不行

雍親王府
2026-06-18 15:50:07
河北學(xué)霸抗癌7年花200萬,親戚勸她別拖累母親,她:我憑啥就該死

河北學(xué)霸抗癌7年花200萬,親戚勸她別拖累母親,她:我憑啥就該死

從零到一研究所
2026-06-17 13:49:18
37歲工程師連續(xù)140天高強度工作后猝死 公司稱“周末不算工傷”,新婚妻子無法接受已向人社局申請工傷認(rèn)定

37歲工程師連續(xù)140天高強度工作后猝死 公司稱“周末不算工傷”,新婚妻子無法接受已向人社局申請工傷認(rèn)定

大風(fēng)新聞
2026-06-18 18:40:20
女子假信佛與多位高僧發(fā)生不當(dāng)關(guān)系,秘密錄制5600段視頻。

女子假信佛與多位高僧發(fā)生不當(dāng)關(guān)系,秘密錄制5600段視頻。

特約前排觀眾
2026-02-09 00:05:05
越南發(fā)現(xiàn)12歲女童患罕見石人綜合征,發(fā)病率極低

越南發(fā)現(xiàn)12歲女童患罕見石人綜合征,發(fā)病率極低

煙雨洛神生
2026-06-17 21:59:14
深圳仙湖樹上現(xiàn)綁縛男性遺骸,警方揭秘一樁塵封已久的悲劇

深圳仙湖樹上現(xiàn)綁縛男性遺骸,警方揭秘一樁塵封已久的悲劇

深夜探案館
2026-06-19 00:46:13
“敢打,我就敢送!”曾放出狠話鼻子朝天的郭臺銘,如今怎么樣了

“敢打,我就敢送!”曾放出狠話鼻子朝天的郭臺銘,如今怎么樣了

秋姐居
2026-06-17 19:28:51
1比0!墨西哥成本屆世界杯首支出線球隊,但韓國隊積3分出線樂觀

1比0!墨西哥成本屆世界杯首支出線球隊,但韓國隊積3分出線樂觀

紅星新聞
2026-06-19 11:46:12
趙勇的冒險,不是“該不該”的問題,是“配不配”的問題。

趙勇的冒險,不是“該不該”的問題,是“配不配”的問題。

寶哥精彩賽事
2026-06-19 16:35:42
狀元熱門迪班薩:希望詹姆斯先別退役 能和他對位打球簡直太瘋狂

狀元熱門迪班薩:希望詹姆斯先別退役 能和他對位打球簡直太瘋狂

羅說NBA
2026-06-19 06:43:18
拄拐觀戰(zhàn)!沒有迪溫琴佐,就沒有尼克斯的冠軍?

拄拐觀戰(zhàn)!沒有迪溫琴佐,就沒有尼克斯的冠軍?

籃球?qū)嶄?/span>
2026-06-19 16:29:50
2000萬億韓元的SK與一場無法和解的離婚案

2000萬億韓元的SK與一場無法和解的離婚案

金哥說新能源車
2026-06-18 12:43:15
局勢徹底反轉(zhuǎn),穆杰塔巴沒吹牛!為了向中國供油,伊朗打算拼一把

局勢徹底反轉(zhuǎn),穆杰塔巴沒吹牛!為了向中國供油,伊朗打算拼一把

占領(lǐng)了思想
2026-05-01 13:30:14
被央視“開除”、美色上位、風(fēng)流成性,王冠身上的標(biāo)簽太離譜了

被央視“開除”、美色上位、風(fēng)流成性,王冠身上的標(biāo)簽太離譜了

青杉依舊啊啊
2026-06-19 17:30:20
特朗普按不住內(nèi)塔,以色列又開打了,不到24小時,中方站出來發(fā)話

特朗普按不住內(nèi)塔,以色列又開打了,不到24小時,中方站出來發(fā)話

戰(zhàn)域筆墨
2026-06-19 15:38:06
解讀信號:親密關(guān)系中的男女如何感知伴侶的性同意?

解讀信號:親密關(guān)系中的男女如何感知伴侶的性同意?

繆斯夫人
2026-06-17 08:05:52
“李梅燒烤”:燒死近50萬人,800萬人流離失所,比原子彈還可怕

“李梅燒烤”:燒死近50萬人,800萬人流離失所,比原子彈還可怕

史之銘
2026-06-12 09:55:26
大連可為1-0淘汰遼寧鐵人挺進十六強,葛宇翔一擊制勝

大連可為1-0淘汰遼寧鐵人挺進十六強,葛宇翔一擊制勝

懂球帝
2026-06-19 17:39:15
2026-06-19 18:04:53
化學(xué)加網(wǎng) incentive-icons
化學(xué)加網(wǎng)
萃聚英才,共享化學(xué)
12743文章數(shù) 8312關(guān)注度
往期回顧 全部

科技要聞

Anthropic被禁,智譜卻漲瘋了

頭條要聞

世界杯"大冷門":史上最小參賽國逼平最大奪冠熱門國

頭條要聞

世界杯"大冷門":史上最小參賽國逼平最大奪冠熱門國

體育要聞

世界杯最不知名球員,沒上場先漲粉600萬

娛樂要聞

吳倩自曝小時被爸爸打掉牙齒硬吞進肚

財經(jīng)要聞

Token低價陷阱

汽車要聞

驚出冷汗!重慶實測奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

數(shù)碼
教育
家居
手機
游戲

數(shù)碼要聞

視頻轉(zhuǎn)碼性能最高提升215%:AMD線程撕裂者突破HandBrake瓶頸

教育要聞

中考因式分解,看似簡單還是要有一定技巧,掌握不難

家居要聞

綠意盎然 自然之境

手機要聞

618大匯總:蘋果成最大贏家,國產(chǎn)誰笑到了最后?

《GTA6》"寫實版"九宮格封面!火辣黑妹太吸睛

無障礙瀏覽 進入關(guān)懷版