免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

專訪馬驍當(dāng)AI推翻80年經(jīng)典數(shù)學(xué)猜想,數(shù)學(xué)家的護城河還能存在多久

0
分享至


圖/OpenAI

編者按:如果這篇論文是由人類撰寫并提交給《數(shù)學(xué)年刊》,來向我征求意見,我會毫不猶豫地推薦接收?!狈茽柶潽劦弥鞯倌鳌じ郀査梗═imothy Gowers)評價一篇剛剛出現(xiàn)在預(yù)印本平臺 arXiv 上的數(shù)學(xué)論文。

論文討論的,是匈牙利數(shù)學(xué)家保羅·埃爾德什1946年提出的Erd?s 平面單位距離猜想。幾十年來,盡管始終無人能夠給出完整證明,但大多數(shù)研究者都傾向于相信猜想成立。

然而,上述論文通過構(gòu)造反例推翻了這個猜想。更關(guān)鍵的是,論文的核心思路并非來自人類,而是OpenAI未公開的一個模型。

這并不是AI第一次闖入數(shù)學(xué)前沿。過去一年間,AI 頻繁出現(xiàn)在數(shù)學(xué)研究的新聞之中。就在2025年底,OpenAI還因夸大AI在數(shù)學(xué)上的進展而陷入爭議,當(dāng)時OpenAI宣稱GPT-5已經(jīng)解決多個“埃爾德什問題”。隨后事實證明,那些所謂成果大多只是發(fā)現(xiàn)了已存在于文獻中的解答。

進入2026年,多個埃爾德什問題陸續(xù)在AI幫助下獲得解決,其中一些成果甚至得到了包括菲爾茲獎得主陶哲軒等多位頂尖數(shù)學(xué)家的確認(rèn)與擴展。特別是四月底23歲的利亞姆·普賴斯(Liam Price)在沒有任何正式數(shù)學(xué)訓(xùn)練的情況下,通過向AI提問獲得了埃爾德什問題#1196的解答。

陶哲軒承認(rèn)AI給出解答的獨創(chuàng)性,他表示“關(guān)注過它的人類數(shù)學(xué)家,集體在第一步就走錯了方向”。很快,他將GPT提出的證明精煉拓展,發(fā)布了一篇論文。

5月20日,OpenAI又宣稱解決了平面單位距離猜想。這次他們請到了9位數(shù)學(xué)家來審核,這些數(shù)學(xué)家在隨后撰寫的文章中,對AI提出的解法給出了高度贊譽。

沃爾夫獎得主諾加·阿隆(Noga Alon)評價“這是一項杰出成就”。蒂莫西·高爾斯還不無憂慮地表示“我們或許已經(jīng)進入一個人類在解決數(shù)學(xué)問題方面很難與AI競爭的時代”。

在單位距離猜想相關(guān)結(jié)果公布后,數(shù)學(xué)研究者馬驍利用 GPT-5.5 Pro 成功復(fù)現(xiàn)了 OpenAI 構(gòu)造的反例。

馬驍現(xiàn)任密歇根大學(xué)數(shù)學(xué)系 Donald J. Lewis Research Assistant Professor,并將于今年入職中國科學(xué)技術(shù)大學(xué)任教授職位。他2018年中國科學(xué)技術(shù)大學(xué)本科畢業(yè),2023年普林斯頓大學(xué)博士畢業(yè),之后到密歇根大學(xué)從事博士后研究。其與鄧煜、Zaher Hani 關(guān)于希爾伯特第六問題的合作研究,嚴(yán)格建立了從微觀粒子運動到宏觀流體方程的數(shù)學(xué)聯(lián)系,被認(rèn)為是希爾伯特第六問題狹義版本上的重要突破。

單位距離猜想的推翻結(jié)果意味著什么?AI會給數(shù)學(xué)研究帶來什么?數(shù)學(xué)家們的護城河還能存在多久?圍繞這些問題,《知識分子》專訪了馬驍。

編輯|張?zhí)炱?

最近,OpenAI 的內(nèi)部模型通過構(gòu)造反例,解決了 Erd?s 平面單位距離猜想。密歇根大學(xué)博士后、即將入職中國科學(xué)技術(shù)大學(xué)的數(shù)學(xué)研究者馬驍,隨后借助 GPT-5.5 Pro 成功復(fù)現(xiàn)了這一構(gòu)造。這說明,類似能力已經(jīng)不只存在于內(nèi)部研究模型中,普通用戶能夠使用的模型也開始接近這一水平。

在外界看來,這似乎是 AI 在數(shù)學(xué)研究中的一次標(biāo)志性突破。但馬驍并不感到特別驚訝。幾個月前,包括他在內(nèi)的不少人就曾利用更早版本的 GPT 解決過若干公開問題。在他看來,那些工作中 AI 展現(xiàn)出的創(chuàng)造力并不比這次低,只是因為沒有 Erd?s 單位距離猜想這么有名,所以沒有引起同樣規(guī)模的關(guān)注。

“我很早就認(rèn)為,它早晚有一天會出來這樣一個新的成果?!?br/>

不過,馬驍也認(rèn)為,這次進展的新聞效應(yīng)可能大于其實際數(shù)學(xué)尺度。它當(dāng)然是一個漂亮而重要的成果,但從證明結(jié)構(gòu)來看,它還不是那種需要幾十頁、上百頁連續(xù)推進的現(xiàn)代數(shù)學(xué)大定理。更準(zhǔn)確地說,它展示的是 AI 在“少跳、跨學(xué)科、高模式匹配”問題上的強大能力。

01 數(shù)學(xué)是多跳思考

馬驍認(rèn)為,數(shù)學(xué)研究本質(zhì)上是一種多跳思考。

什么是“一跳”呢?研究者面對一個目標(biāo)時,往往需要不斷拆解出子目標(biāo),并一步步解決它們。每解決一個小目標(biāo),就相當(dāng)于完成了一跳。一個證明可能只有幾跳,也可能需要幾十跳、上百跳。

完成每一跳,依賴的不只是邏輯推理,也依賴知識積累、對理論的熟悉程度,以及模式識別能力。很多時候,數(shù)學(xué)家之所以能想到某個方向,是因為他見過足夠多相似結(jié)構(gòu),知道某個工具在這里可能有用。

從這個角度看,AI 在少跳問題上已經(jīng)表現(xiàn)出很強能力。它接觸過大量數(shù)學(xué)內(nèi)容,熟悉許多不同領(lǐng)域的工具,因此在快速調(diào)用知識、識別結(jié)構(gòu)、完成跨領(lǐng)域聯(lián)想的問題上,有時會展現(xiàn)出驚人的表現(xiàn)。

02 這次為什么仍然是“少跳問題”

Erd?s 單位距離問題問的是:平面上給定 (n) 個點,最多能出現(xiàn)多少對距離為 1 的點?

這個問題看起來屬于離散幾何或組合數(shù)學(xué),但這次 AI 給出的反例構(gòu)造,用到了很深的代數(shù)數(shù)論工具。

證明中確實有跨領(lǐng)域跳躍。粗略拆開,大約有六七跳:從“證明上界”轉(zhuǎn)向“尋找反例”,再回到 Erd?s 的格點構(gòu)造;從平方格點聯(lián)想到高斯整數(shù);再從高斯整數(shù)推廣到更一般的數(shù)域整數(shù)環(huán);隨后引入高維格點與平面投影,把數(shù)論構(gòu)造轉(zhuǎn)化為平面單位距離構(gòu)造;最后再用分裂素數(shù)、類群和類域塔等工具控制參數(shù)。

這些轉(zhuǎn)換對大多數(shù)研究者而言并不自然,因此長期沒有被充分探索。

但如果把證明鏈條展開,會發(fā)現(xiàn)核心邏輯其實只有有限幾跳,證明篇幅也只有幾頁。它的難點更多在于找到正確的跨學(xué)科連接,而不是完成一個上百頁級別的長鏈條證明。

因此,在馬驍看來,這次進展更接近頂級 IMO(國際數(shù)學(xué)奧賽)題目的跳躍方式與跳躍次數(shù)。這里的“IMO 級別”并不是說數(shù)學(xué)工具簡單。恰恰相反,證明中用到了 CM 域、數(shù)域整數(shù)環(huán)、類群、分裂素數(shù)、類域塔等專業(yè)數(shù)論工具,遠(yuǎn)超高中競賽范圍。

但如果忽略知識門檻,只看思維結(jié)構(gòu),它像一道非常難的競賽題:真正關(guān)鍵的是少數(shù)幾個不容易想到的轉(zhuǎn)化。一旦找到了正確視角,證明本身并不需要特別漫長的連續(xù)執(zhí)行。很多人喜歡低估 IMO 題目的難度,其實頂級 IMO 題目在思維跳躍上已經(jīng)不輸于很多科研問題,只是問題本身的重要性不同。

這說明 AI 已經(jīng)能在少跳問題上完成很強的跨學(xué)科創(chuàng)造,但還不能說明 AI 已經(jīng)能夠穩(wěn)定完成長篇幅、強執(zhí)行、強驗證的數(shù)學(xué)研究。

03 人類數(shù)學(xué)家為什么沒做出來?

馬驍認(rèn)為,人類數(shù)學(xué)家長期沒有破解這個猜想,并不只是因為問題本身困難,也和數(shù)學(xué)家的工作方式有關(guān)。

組合數(shù)學(xué)家往往不會長期死磕某一個著名猜想。他們更常見的方式,是先發(fā)展自己的理論體系,等理論成熟之后,再去看哪些問題可以用這些理論解決。

因此,許多著名猜想對他們來說,更像是一種 benchmark:它們可以用來測試?yán)碚撌欠裼辛α浚幢厥茄芯空咭婚_始就全力攻克的目標(biāo)。

另一個原因是,這次 AI 的解法用到了較深的代數(shù)數(shù)論知識。這個領(lǐng)域?qū)W習(xí)門檻很高,很少有組合數(shù)學(xué)家會專門投入大量時間學(xué)習(xí)這些方法,只為了嘗試解決一個特定的組合問題。反過來,代數(shù)數(shù)論專家雖然也有人考慮過這個問題,但他們對組合數(shù)學(xué)和離散幾何的了解又未必足夠深入。

于是,這個問題長期處在兩個領(lǐng)域之間的縫隙里。

而跨領(lǐng)域知識的調(diào)用與重組,恰恰是 AI 的長處。


圖/OpenAI

此前已知的一種構(gòu)造,由縮放后的正方形網(wǎng)格產(chǎn)生大量單位距離點對。

04 AI 的優(yōu)勢是跨度,短板是執(zhí)行

馬驍過去也曾嘗試用 AI 證明一些數(shù)學(xué)問題。

他舉例說,在一個極小曲面中的微分幾何問題上,AI 想到的是代數(shù)幾何的解法;而在一些統(tǒng)計學(xué)問題上,AI 會從多復(fù)變的角度切入。

“它的思路跨度確實是非常大的,懂得特別多。”

但這不意味著 AI 已經(jīng)能夠超過數(shù)學(xué)家。

馬驍認(rèn)為:

“在目前這個階段,如果是在數(shù)學(xué)家自己最擅長的方向上,AI 通常還很難真正超過他本人。”

原因在于,在數(shù)學(xué)家最熟悉的方向上,他往往已經(jīng)知道應(yīng)該怎么做。真正困難的不是想出一個方向,而是沿著這個方向正確執(zhí)行大量步驟,把所有細(xì)節(jié)嚴(yán)謹(jǐn)?shù)匮a完。

這正是當(dāng)前 AI 的短板。

如果一個問題已經(jīng)有相對明確的思路,只是需要在大量細(xì)節(jié)上不斷嘗試和推進,AI 的表現(xiàn)還不夠穩(wěn)定。尤其是在需要長時間規(guī)劃、持續(xù)探索、反復(fù)驗證的任務(wù)上,AI 目前仍然有限。

因此,在現(xiàn)階段,AI 更像是一個能提出方案、提供靈感、幫助驗證局部細(xì)節(jié)的工具,而不是能夠獨立完成完整研究計劃的數(shù)學(xué)家。


圖/OpenAI

05 復(fù)現(xiàn)不是自動完成的

從馬驍復(fù)現(xiàn)這次成果的過程,也能看出讓 AI 產(chǎn)出數(shù)學(xué)發(fā)現(xiàn)并不是一件輕松的事。

他發(fā)現(xiàn),如果直接把問題交給模型,通常很難得到有效答案。因此,他采用了一種“計劃與執(zhí)行”(Plan and Execute)的模式。

具體來說,他先讓 AI 列出幾種可能的解決思路,再由自己進行篩選。由于每一步的分支數(shù)量有限,再加上他一開始就明確告訴 AI“這個命題是錯的”,AI 給出的候選方向并不算太多。通過這種“人做決策,AI 提供方案”的方式,最終成功復(fù)現(xiàn)了破解猜想的方案。

但即使找到正確方向,AI 輸出的內(nèi)容也不能直接作為論文證明。

馬驍表示,GPT 生成的證明經(jīng)常會跳過關(guān)鍵細(xì)節(jié),有時還會出現(xiàn)小錯誤,不符合論文標(biāo)準(zhǔn)。整理、補全和重寫這些證明,本身就需要大量工作。AI 也經(jīng)常生成錯誤結(jié)果,因此驗證同樣耗時。

他的辦法是把驗證工作放到全新的對話框里單獨進行。

“新的對話框或者在已有對話框里專門要求驗證的,一般都是對的,驗證能力也很強,但是 AI 還不能完全自主地同時做到證明強和驗證強。”

06 數(shù)學(xué)家還能安心多久

雖然馬驍認(rèn)為這次進展沒有外界想象中那么大,但他也認(rèn)為,不應(yīng)該低估 AI 對數(shù)學(xué)未來的影響。

如果 AI 只能完成幾頁證明,那么它的能力仍然主要局限在少跳問題上。它可以提出跨學(xué)科想法,也可以解決一些短而巧的問題,但還無法替代數(shù)學(xué)家完成復(fù)雜的長鏈條研究。

但是,隨著智能體領(lǐng)域的快速發(fā)展,情況一定會發(fā)生變化。

未來的 AI 會越來越像一個完整的研究系統(tǒng):它能夠規(guī)劃目標(biāo),展開搜索,驗證中間結(jié)論,發(fā)現(xiàn)錯誤后自我修正,并不斷提高連續(xù)正確執(zhí)行的次數(shù)。換句話說,AI 能穩(wěn)定完成的數(shù)學(xué)證明長度,幾乎必然會逐步提升。

如果 AI 能夠穩(wěn)定完成的長度從 10 頁增長到 30 頁,再從 30 頁增長到 100 頁,那么數(shù)學(xué)研究的格局將不只是發(fā)生局部變化,而是可能被徹底重塑。

一旦 AI 能夠處理百頁級別的證明,它的數(shù)學(xué)能力將遠(yuǎn)遠(yuǎn)超過任何單個數(shù)學(xué)家,甚至可能超過全體數(shù)學(xué)家能夠同時覆蓋的范圍。那時,圍棋的故事有可能復(fù)現(xiàn)——AI 像上帝一樣,人類數(shù)學(xué)家和 AI 合作可能不如 AI 自己。

而這一天,按照目前智能體的發(fā)展速度來看,不一定會太久,最早可能是今年年底,也可能是明年。

馬驍說,是時候來思考未來我們應(yīng)該做什么了。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
甘肅通渭李女士事件大反轉(zhuǎn)!聊天記錄曝光:從被動接受到主動迎合

甘肅通渭李女士事件大反轉(zhuǎn)!聊天記錄曝光:從被動接受到主動迎合

火山詩話
2026-06-19 08:19:30
為讓中國加入北約,美國竟愿意白送武器,卻被我國無情拒絕

為讓中國加入北約,美國竟愿意白送武器,卻被我國無情拒絕

大運河時空
2026-06-18 18:40:03
最新結(jié)果!13票贊成0票反對,菲律賓政壇“變天”?菲或向俄求助

最新結(jié)果!13票贊成0票反對,菲律賓政壇“變天”?菲或向俄求助

策前論
2026-06-18 19:18:19
賈乃亮回應(yīng)常年直播不拍戲:沒辦法,我演員天賦不強,演戲不好

賈乃亮回應(yīng)常年直播不拍戲:沒辦法,我演員天賦不強,演戲不好

韓小娛
2026-06-19 07:50:25
把高純鎢轉(zhuǎn)賣日本?韓國自食其果,高市沒料到,中方動作這么快

把高純鎢轉(zhuǎn)賣日本?韓國自食其果,高市沒料到,中方動作這么快

共工之錨
2026-06-19 15:28:53
崩盤上漲:A股“精神病式”撕裂背后的真相

崩盤上漲:A股“精神病式”撕裂背后的真相

墨染時光
2026-06-19 07:15:41
美國斷供C919發(fā)動機1年后,世界才發(fā)現(xiàn),中國造出了一臺更好的

美國斷供C919發(fā)動機1年后,世界才發(fā)現(xiàn),中國造出了一臺更好的

商業(yè)財經(jīng)風(fēng)向
2026-06-18 10:39:45
華為注冊“世界”商標(biāo)通過初審!

華為注冊“世界”商標(biāo)通過初審!

芯智訊
2026-06-19 13:34:35
一場遲到的“斷舍離”,山水酒店連虧6年負(fù)債5.25億元,中青旅忍痛切割

一場遲到的“斷舍離”,山水酒店連虧6年負(fù)債5.25億元,中青旅忍痛切割

華夏時報
2026-06-19 10:10:05
緬甸總統(tǒng)坐復(fù)興號后沉默了,350公里時速,他看到兩個時代的差距

緬甸總統(tǒng)坐復(fù)興號后沉默了,350公里時速,他看到兩個時代的差距

小影的娛樂
2026-06-19 10:07:13
又是血洗!卡塔爾就不該進入世界杯,日本球迷:名額給中國國足

又是血洗!卡塔爾就不該進入世界杯,日本球迷:名額給中國國足

酷侃體壇
2026-06-19 15:57:12
阿聯(lián)酋、埃及、沙特等八國外長發(fā)表聯(lián)合聲明:以“最強烈措辭”譴責(zé)以色列定居者暴力行為

阿聯(lián)酋、埃及、沙特等八國外長發(fā)表聯(lián)合聲明:以“最強烈措辭”譴責(zé)以色列定居者暴力行為

環(huán)球網(wǎng)資訊
2026-06-19 09:51:27
克洛澤16球王座終于有人摸到了——目前或僅有這三人有機會!

克洛澤16球王座終于有人摸到了——目前或僅有這三人有機會!

觀星娛記
2026-06-19 11:55:14
寶媽避雨被趕后續(xù):大批顧客退單,商家道歉也無果,門店口碑崩了

寶媽避雨被趕后續(xù):大批顧客退單,商家道歉也無果,門店口碑崩了

千言娛樂記
2026-06-18 18:59:27
極速達,害了山姆

極速達,害了山姆

中國新聞周刊
2026-06-19 13:14:39
“順德漁村”驅(qū)趕躲雨母子刷屏:路人,連停留的資格都不配?

“順德漁村”驅(qū)趕躲雨母子刷屏:路人,連停留的資格都不配?

李晚書
2026-06-19 10:45:00
匪夷所思!“濮陽護士長”悄悄上熱搜,“19分28秒”等標(biāo)簽滿天飛

匪夷所思!“濮陽護士長”悄悄上熱搜,“19分28秒”等標(biāo)簽滿天飛

火山詩話
2026-06-18 17:00:53
男子深夜醉駕致16歲少女被撞身亡,血檢濃度238mg/100mL,最初認(rèn)定肇事者全責(zé),申請復(fù)議后變主責(zé),警方回應(yīng):按正規(guī)程序進行

男子深夜醉駕致16歲少女被撞身亡,血檢濃度238mg/100mL,最初認(rèn)定肇事者全責(zé),申請復(fù)議后變主責(zé),警方回應(yīng):按正規(guī)程序進行

大風(fēng)新聞
2026-06-19 15:30:09
孫興慜57分鐘0射門引熱議:被嘲像女星 在兒童區(qū)沖刺 亞洲一哥們

孫興慜57分鐘0射門引熱議:被嘲像女星 在兒童區(qū)沖刺 亞洲一哥們

顏小白的籃球夢
2026-06-19 14:04:45
女子上午上吊身亡,下午就被埋葬,警察讓挖掘機將她的棺材挖出來

女子上午上吊身亡,下午就被埋葬,警察讓挖掘機將她的棺材挖出來

千秋文化
2026-06-18 19:46:12
2026-06-19 19:55:00
知識分子 incentive-icons
知識分子
關(guān)注科學(xué)、人文、思想
682文章數(shù) 1116關(guān)注度
往期回顧 全部

科技要聞

Anthropic被禁,智譜卻漲瘋了

頭條要聞

婚禮短片現(xiàn)"別人老公老婆"新娘忍整場 不料有更離譜的

頭條要聞

婚禮短片現(xiàn)"別人老公老婆"新娘忍整場 不料有更離譜的

體育要聞

世界杯最不知名球員,沒上場先漲粉600萬

娛樂要聞

吳倩自曝小時被爸爸打掉牙齒硬吞進肚

財經(jīng)要聞

Token低價陷阱

汽車要聞

驚出冷汗!重慶實測奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

本地
時尚
教育
旅游
公開課

本地新聞

世界杯黑馬佛得角:河北人開超市,溫州人當(dāng)老板

夏天上衣穿短不穿長,看看下面這幾款短上衣,顯高舒適顯比例

教育要聞

出了考場談女權(quán),這多少有些讓人意外,很難不引起人警覺

旅游要聞

品味傳統(tǒng) 暢享假日丨樂享端午

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版