免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網易首頁 > 網易號 > 正文 申請入駐

人類56年解不出,谷歌AI一夜連破9道世紀難題!

0
分享至


新智元報道


【新智元導讀】DeepMind發(fā)布全新數學智能體AlphaProof Nexus,9道Erd?s開放難題一次性告破,最老的懸了56年!全部證明都已經過Lean編譯器形式化驗證,沒有幻覺。網友驚呼:數學奇點的火花點燃了。

數學界這個月,徹底瘋了。

前腳OpenAI剛把Erd?s 80年猜想推翻,數學家們的驚呼聲還沒落地。

緊接著,Google DeepMind發(fā)布了一個全新AI數學智能體——AlphaProof Nexus


論文地址:https://arxiv.org/abs/2605.22763v1

它一出手,就干掉了9道懸而未決幾十年的Erd?s開放問題。其中最古老的那個,懸了整整56年!

而且,每道題花費的算力成本,只有幾百美元。

更關鍵的是,這次的證明不可能有錯。

每一步推理都經過Lean編譯器的形式化驗證,不存在幻覺空間。編譯器通過,證明就是對的。


值得一提的是,AlphaProof Nexus和2024年拿下IMO銀牌的初代AlphaProof完全不同。

初代只有強化學習樹搜索,Nexus把大語言模型、AlphaProof和進化算法三合一,直接瞄準了人類數學家啃不動的研究級難題。

AlphaProof Nexus

進化算法+LLM+Lean編譯器

這套系統的架構分為四個層級,從簡單到復雜。

1. Agent A(基礎版)

多個獨立的證明子智能體并行工作,每個子智能體與Gemini 3.1 Pro進行多輪對話,通過搜索替換工具修改Lean代碼,編譯器實時反饋錯誤信息,子智能體根據反饋迭代修正。

2. Agent B

在A的基礎上加入了AlphaProof作為工具。當子智能體在某個子目標上卡住時,可以調用AlphaProof進行強化學習驅動的樹搜索,嘗試攻克局部難點。

3. Agent C

引入進化算法。多個子智能體不再獨立工作,而是共享一個「種群數據庫」。每個證明草稿會被LLM評審員打分(用Elo評分系統),高分草稿被優(yōu)先采樣、變異、進化。

4. Agent D(完整版)

集大成者。進化算法 + AlphaProof + Gemini 3.1 Pro協同作戰(zhàn)。這是DeepMind用來大規(guī)模掃蕩Erd?s問題的主力武器。


整個工作流的核心循環(huán)非常清晰——

AI提出證明草稿 → Lean編譯器驗證 → 失敗則反饋錯誤信息 → AI修正 → 再驗證 → 循環(huán)往復,直到證明完全通過或耗盡算力預算。

Erd?s #125為例,它的解題過程是這樣的。

首先,子智能體先用思維鏈推理分析問題結構,然后通過搜索替換修改Lean代碼,接著調用AlphaProof處理子目標。


AlphaProof搞定了6個子目標中的3個,子智能體隨即將剩余的「硬骨頭」分解為更小的引理,再次調用AlphaProof——這次,全部搞定。

整個過程中,沒有任何人類數學家介入。

9道Erd?s問題

56年前的懸案一朝告破

DeepMind將完整版Agent D投放到353道已形式化的Erd?s問題上。每道題最多允許3000輪迭代。

最終,9道問題被攻克。


其中含金量最高的幾道:

1. Erd?s #12(1970年提出)

是否存在一個無限集A,滿足「任意三個不同元素a


這道題懸置了56年,期間多位數學家取得了部分進展,但始終無法給出完整構造。

AI的解法精妙地結合了中國剩余定理和三項等差數列回避集,通過構建一系列精心設計的「區(qū)塊」來同時滿足密度條件和整除約束。

2. Erd?s #125(1996年提出)

在三進制下只用數字0和1的整數集A,加上四進制下只用數字0和1的整數集B,它們的和集A+B的下密度是否為正?


AI證明了答案是否定的——下密度為零。

證明的核心是一個歸納稀疏化論證,巧妙利用了3^m和4^k的丟番圖逼近性質(log4/log3是無理數),通過反復找到兩個基數幾乎對齊的尺度,讓密度以0.99的比率逐步衰減到零。

3. Erd?s #138(1981年提出的變體)

van der Waerden數W(k+1) - W(k)是否趨于無窮?

AI給出了一個極其優(yōu)雅的證明:W(k+1) ≥ W(k) + k。核心思路是貪心染色擴展——在一個沒有單色k-AP的2-著色基礎上,逐個添加新元素,用反證法說明貪心策略不會失敗。

4. Erd?s #846

這是一個關于平面點集中共線性質的問題。


而AI的構造,令人嘆為觀止。

它把完全圖K∞的每條邊映射到平面上的一個點,用二次多項式編碼坐標,然后利用無窮Ramsey定理完成證明。

目前,所有9道問題的Lean證明代碼已開源在GitHub上。


項目地址:https://github.com/google-deepmind/alphaproof-nexus-results

簡單Agent也能解全部9題?!

最出人意料的結論,不是完整版Agent D有多強,而是——

最簡單的Agent A,也能解決全部9道問題。

Agent A沒有進化算法,沒有AlphaProof,只有多個獨立的LLM子智能體和Lean編譯器的反饋循環(huán)。

根據DeepMind團隊的對比分析,它在大多數問題上,Agent A和Agent B(加了AlphaProof的版本)的表現在誤差范圍內幾乎相同。

相比之下,Agent D的優(yōu)勢主要體現在最困難的問題上(比如#125和#138),能以2到5倍的成本優(yōu)勢完成證明。


對此,DeepMind將基礎Agent的成功歸因于兩個因素:LLM自身能力的飆升,以及編譯器反饋在錨定LLM推理方面的強大作用。

也就是說,隨著基礎模型越來越強,復雜的系統工程可能逐漸讓位于簡單的智能體循環(huán)。

今天需要進化算法和AlphaProof協同作戰(zhàn)才能高效解決的問題,明天可能一個樸素的LLM+編譯器循環(huán)就夠了。


具體到成本,最便宜的一道題(#741(ii))中位成本僅5-7美元,最貴的(#152)也不過200-400美元。

但前提是用對了模型——單獨運行AlphaProof或使用較小模型(Gemini 3.0 Flash等),9道題一道都解不出來。


代數幾何15年懸案、凸優(yōu)化新界一并搞定

除了Erd?s問題,AlphaProof Nexus還在多個數學分支中取得了實質性突破:

OEIS猜想系統自動形式化了492個開放猜想,證明了其中44個。為防止形式化錯誤,系統要求先證明「測試引理」——驗證序列前幾項與形式化定義一致——才能嘗試目標猜想。

代數幾何解決了一個懸置約15年的開放問題——證明了余維數3、類型2的純O-序列的對數凹性。這個問題此前被認為是該領域最后一個主要未解情況。

凸優(yōu)化解決了一個關于錨定梯度下降-上升算法(Anchored GDA)精確收斂速率的開放問題。更妙的是,AI不僅驗證了一個固定算法,還在證明過程中自主搜索并發(fā)現了一個新的學習率調度參數,從而實現了更強的保證。

圖論證明了Graffiti系統在1996年提出的一個關于生成樹葉子數與局部獨立集的猜想,形成了一個有趣的閉環(huán)——AI證明了另一個AI提出的猜想。

加法組合學幫助解決了Ben Green著名開放問題列表中的第57題。

量子光學與Mario Krenn合作,解決了多個關于單色量子圖的猜想,對應高維GHZ量子態(tài)的構造。


三路合圍,數學前沿全面失守

2026年5月,AI在數學領域的造詣,幾乎同時達到了研究級水平。

OpenAI走的是自然語言路線。

通用推理模型直接輸出證明,推翻了Erd?s 80年單位距離猜想。證明極其精妙,但驗證它需要人類頂級專家逐行審查。

菲爾茲獎得主Gowers把未解問題扔給GPT-5.5 Pro,兩小時拿到博士論文級成果,全程數學貢獻為零。

DeepMind走的是形式化驗證路線。

AlphaProof Nexus讓AI用Lean語言寫證明代碼,編譯器自動檢查每一步推理。任何一步出現邏輯斷裂,編譯器直接報錯,證明被拒絕。

自然語言路線靈活,但可能有幻覺。形式化路線可靠,但目前局限于Lean數學庫成熟的領域。

而DeepMind的數學家合作者發(fā)現了一個意料之外的收獲——

即使智能體無法證明目標定理,它生成的證明嘗試也加深了他們對問題的理解。因為草稿是形式化的,專家可以直接聚焦于未解決的子目標,而不需要重新驗證整個論證鏈。

換句話說,AI不只是在解題,它正在改變數學家思考問題的方式。

如今,未來的圖景已經浮現:

AI先用自然語言探索證明思路,再用形式化系統逐步固化和驗證。

人類數學家的角色,則從「親手推導」轉向「提出問題、審查方向、提煉洞見」。

有人說,我們正目睹數學奇點的早期火花。


幾百美元算力,幾十小時運行,56年懸案告破,編譯器給出鐵證。

保羅·埃爾德什生前留下了1217道數學難題,懸賞后人求解。

他大概從未想過,有一天來領賞的,不是人類。

參考資料:

https://x.com/prz_chojecki/status/2058435083741061359?s=20

https://arxiv.org/abs/2605.22763v1

編輯:摩西

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
寶媽避雨被趕后續(xù):大批顧客退單,道歉也難平眾怒,門店口碑崩了

寶媽避雨被趕后續(xù):大批顧客退單,道歉也難平眾怒,門店口碑崩了

石辰搞笑日常
2026-06-19 08:38:34
韓國隊0比1不敵墨西哥背后:孫興慜已從隊內一哥,變成隊內一哥們

韓國隊0比1不敵墨西哥背后:孫興慜已從隊內一哥,變成隊內一哥們

姜大叔侃球
2026-06-19 11:34:14
甘肅通渭李女士事件大反轉!聊天記錄曝光:從被動接受到主動迎合

甘肅通渭李女士事件大反轉!聊天記錄曝光:從被動接受到主動迎合

火山詩話
2026-06-19 08:19:30
湖北18歲美女胡小敏去世!在臺球室上班,滿屏電子鮮花,閨蜜發(fā)聲

湖北18歲美女胡小敏去世!在臺球室上班,滿屏電子鮮花,閨蜜發(fā)聲

追蹤之點
2026-06-19 13:03:23
柬埔寨電詐最大黑手竟然是副總理?

柬埔寨電詐最大黑手竟然是副總理?

鳳眼論
2026-06-18 18:45:10
特斯拉51%市占率碾壓群雄,對手潰不成軍

特斯拉51%市占率碾壓群雄,對手潰不成軍

墜入溫柔晚風
2026-06-18 00:37:33
美國斷供C919發(fā)動機1年后,世界才發(fā)現,中國造出了一臺更好的

美國斷供C919發(fā)動機1年后,世界才發(fā)現,中國造出了一臺更好的

商業(yè)財經風向
2026-06-18 10:39:45
央行、證監(jiān)會最新發(fā)聲 推動中長期資金入市

央行、證監(jiān)會最新發(fā)聲 推動中長期資金入市

南方都市報
2026-06-19 07:04:29
李毅解說比賽半場被換!媒體人:一個中國退役球員教世界球星踢球

李毅解說比賽半場被換!媒體人:一個中國退役球員教世界球星踢球

風過鄉(xiāng)
2026-06-19 09:44:15
流浪26年滿身污垢的沈巍,如今身價百萬還有小15歲女友,他憑的啥

流浪26年滿身污垢的沈巍,如今身價百萬還有小15歲女友,他憑的啥

從零到一研究所
2026-06-18 16:15:07
印度網友說中國也有種姓制度,仔細一看,真的讓人笑掉大牙!

印度網友說中國也有種姓制度,仔細一看,真的讓人笑掉大牙!

全城探秘
2026-06-18 18:06:57
大批網約車司機翻車!早年跟風買運電車,如今進退兩難熬不下去

大批網約車司機翻車!早年跟風買運電車,如今進退兩難熬不下去

老特有話說
2026-06-18 14:49:24
顧客稱老鄉(xiāng)雞餐具圖案掉色印到蒸蛋上,老鄉(xiāng)雞最新回應:餐具材質為陶瓷,符合國標,掉色原因系表面裝飾層物理磨損

顧客稱老鄉(xiāng)雞餐具圖案掉色印到蒸蛋上,老鄉(xiāng)雞最新回應:餐具材質為陶瓷,符合國標,掉色原因系表面裝飾層物理磨損

大風新聞
2026-06-19 08:44:11
1男7女被遺忘在孤島,8年后被美軍巡查船解救,8人已變成35人!

1男7女被遺忘在孤島,8年后被美軍巡查船解救,8人已變成35人!

香姨談史
2026-06-11 08:50:11
理想智駕負責人實測FSD后:國內無第一梯隊,別再自我麻痹

理想智駕負責人實測FSD后:國內無第一梯隊,別再自我麻痹

我是一個粉刷匠2
2026-06-18 02:58:29
大媽順走奔馳螺絲后續(xù)!長相曝光,被老板找到后說:以為你不要了

大媽順走奔馳螺絲后續(xù)!長相曝光,被老板找到后說:以為你不要了

寒士之言本尊
2026-06-18 17:37:03
爭議!央視社媒刪梅西內容 網友爆料:23點緊急通知 直播別給特寫

爭議!央視社媒刪梅西內容 網友爆料:23點緊急通知 直播別給特寫

念洲
2026-06-19 09:28:22
英國將向烏克蘭提供15萬架無人機

英國將向烏克蘭提供15萬架無人機

財聯社
2026-06-18 21:40:25
中午12點!CCTV5直播日本隊世界杯“生死戰(zhàn)”,輸球=小組難晉級

中午12點!CCTV5直播日本隊世界杯“生死戰(zhàn)”,輸球=小組難晉級

寶哥精彩賽事
2026-06-19 10:21:26
耿同學反殺母校副院長!女導師的男領導,與1.2億估值

耿同學反殺母校副院長!女導師的男領導,與1.2億估值

大江看潮
2026-06-19 10:23:04
2026-06-19 15:51:00
新智元 incentive-icons
新智元
AI產業(yè)主平臺領航智能+時代
15499文章數 66926關注度
往期回顧 全部

科技要聞

Anthropic被禁,智譜卻漲瘋了

頭條要聞

男子醉駕撞死16歲少女 最初被認定全責復議后變主責

頭條要聞

男子醉駕撞死16歲少女 最初被認定全責復議后變主責

體育要聞

加拿大球員小腿變形重傷 亞洲冠軍輸球輸人

娛樂要聞

吳倩自曝小時被爸爸打掉牙齒硬吞進肚

財經要聞

Token低價陷阱

汽車要聞

驚出冷汗!重慶實測奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

教育
藝術
親子
公開課
軍事航空

教育要聞

第31課-飛機上,如何讓外國人愿意跟你換座位?

藝術要聞

臺北東區(qū)新門戶!南港雙星,像一道“城市裂痕”

親子要聞

“全班停課10天”!深圳不少娃中招!廣東5月新增27849例,近期高發(fā)千萬留意

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

霸氣!端午節(jié)最硬核的“龍舟”競渡來了

無障礙瀏覽 進入關懷版