免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網易首頁 > 網易號 > 正文 申請入駐

突發(fā)!Anthropic呼吁全員停止AI研究

0
分享至

Jay 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

重要發(fā)現(xiàn):AI的自進化,開始了。

這是Anthropic剛剛在長文博客中,發(fā)表的暴論。

我們的內部數(shù)據(jù)顯示,Claude正在加速AI發(fā)展,這可能是一條遞歸自我提升(RSI)的路徑。



并非「危言聳聽」,看了下文章,Anthropic是真的實打實地用數(shù)據(jù)在說話——

截止今年5月,80%以上的Anthropic代碼,都是Claude寫的。

而在Claude Code發(fā)布之前,這個數(shù)字還僅是個位數(shù)。

與此同時,Anthropic工程師平均每季度交付的代碼量,是2021-2025年的8倍。



更重要的是質量——

在最開放、最模糊、連答案長什么樣都不確定的編程任務上,Claude的成功率現(xiàn)在是76%,六個月前才26%。

50個百分點的跳升。半年。



Anthropic內部已經有不少工程師覺得,Claude寫的代碼質量和人類打平了。

預計年內會超過。

Anthropic還強調,如果這個趨勢持續(xù)下去,AI自己設計和構建下一代AI,是完全可能的。

這可能徹底改變社會,在醫(yī)療、科技、經濟領域帶來巨大的好處。但也可能讓對齊問題疊加惡化,最終導致失控。

因此,Anthropic帶頭呼吁:

如果存在一個可驗證的機制,能保證AI實驗室確實都沒偷偷卷,我們愿意減速、甚至暫停。

除此之外,Anthropic的這篇博客里,還放出了蠻多有意思的觀點和事實。

以下是經過整理,更方便大家閱讀的版本。

Enjoy。

Anthropic長文定調

AI圈的摩爾定律來了

Anthropic創(chuàng)建了個全新的衡量維度,叫「AI能獨立完成的任務時長」。

2024年3月,Claude Opus 3能搞定人類大概需要4分鐘的軟件任務。

一年后,Claude Sonnet 3.7,1.5小時。

又一年,Claude Opus 4.6,12小時。

而最新的Mythos,在內測中的表現(xiàn)是:

能連續(xù)工作「至少」16小時,已經到了METR測試框架能衡量的上限了。

這個翻倍速度,從原來的每7個月翻一倍,加速到了每4個月翻一倍。

如果趨勢不變,2027年,可能是好幾周。



Claude編寫了大部分Anthropic代碼

截至2026年5月,我Anthropic代碼庫的代碼,超過80%由Claude編寫。
在Claude Code發(fā)布前,這個數(shù)字一直只有個位數(shù)。

這種變化,也體現(xiàn)在工程師的工作方式上。

在 Anthropic 的最初四年,工程師每天Merge的代碼行數(shù)基本保持不變。

2025年, Claude開始自己寫代碼,merge數(shù)突然開始飆升。

如今,2026年第二季度,工程師每天merge的代碼量是2024年的8倍。



不過,代碼量上去了,代碼質量是不是注水了?

Anthropic說,這一年來,工程師糾正Claude的次數(shù),越來越少了。

這一點,在benchmark中可見一斑,如下圖所示。

所有難度類型的任務中,Claude的成功率,無一例外的一路暴增。



所以,Anthropic現(xiàn)在干脆用Claude來review代碼。

是的,所有提交到代碼庫的改動,都會先過一遍Claude自動審查,檢查bug、安全漏洞和其他缺陷。

他們回溯分析發(fā)現(xiàn),如果之前每次改動都有這道自動審查,大約三分之一導致claude.ai線上事故的bug,上線之前就會被攔下來。

要知道,寫那些代碼的工程師,已經是全世界造AI系統(tǒng)最頂尖的一批人了。

Claude在抓他們的錯誤。

創(chuàng)造力的放大鏡

接下來是Claude在研究層面的參與程度。

Anthropic有個慣例,每次發(fā)新模型,都會給Claude一段訓練小型AI模型的代碼,讓它在保證正確性的前提下,把運行速度優(yōu)化到最快。

2025年5月,Claude Opus 4交出的答案是:加速3倍。

2026年4月,Claude Mythos Preview做到了52倍。

作為參考,一個熟練的人類研究員,需要4到8個小時才能勉強達到4倍。

不到一年的時間,Claude超過了人類。

2026年4月,Anthropic丟給Claude一個AI安全研究,大意是「一個弱模型能不能可靠地監(jiān)督一個強模型」,然后讓Claude自己提假設、跑實驗……

這次先說人類的表現(xiàn)吧,兩個人類研究員花了大約一周時間,把gap縮小了23%。

而Claude,在大約800小時、花了大約18000美元的算力之后——

縮小了97%。



我們何去何從?

到這里為止,結論已經很清楚了。

人類在AI開發(fā)流程里的角色,每一個環(huán)節(jié)都在收窄。

代碼,Claude寫了。代碼review,Claude做了。實驗執(zhí)行,Claude快了人類一個數(shù)量級。實驗設計,Claude開始自己來了……

人類現(xiàn)在最后的比較優(yōu)勢,是研究品味和判斷力。

但這個優(yōu)勢能守多久?

Anthropic在博客里說,他們也不確定。

一種可能是,「研究品味」就像之前AI不會的其他東西一樣,先是做不到,然后突然就做到了。

就像AI理解幽默、展示心智理論、解語言謎題,都經歷了同樣的曲線。

另一種可能是,即便Claude永遠學不會真正的研究品味,僅靠現(xiàn)在的加速趨勢,每個人類研究員能同時指揮的工作量已經大了好幾倍。

你不需要AI完全替代你思考,它只要把所有「執(zhí)行」的活全干了,你就只需要做那5%的方向選擇。



RSI的三種未來

博客結尾,Anthropic描繪了關于這次「自進化」趨勢三個可能演化方向。

1、停滯。

那些指數(shù)曲線其實是S曲線。

也許研究判斷力這個東西就是沒法靠scale解決,需要一種全新的架構突破。

或者,瓶頸在能源、在芯片、在算力的物理供應鏈上。

不過,即便AI的能力就停滯在今天的水平,也會發(fā)生對世界帶來重大變化。

前段時間的Project Glasswing,Mythos Preview在上線頭幾周就發(fā)現(xiàn)了超過一萬個高危和嚴重級別的軟件漏洞,遍布全球最關鍵的系統(tǒng)。

2、AI持續(xù)加速,但人類仍然把著方向盤。

組織效率會指數(shù)級提升,100人的公司做1萬甚至10萬人的活。知

Anthropic覺得我們大概率正在走進這個場景。

但他們也發(fā)現(xiàn)了一個有意思的現(xiàn)象,就是阿姆達爾定律在組織里的體現(xiàn)_

Claude把代碼寫得飛快了,結果代碼review變成了新瓶頸。各種新想法、新工具、新實驗爆炸式涌現(xiàn),遠超組織的消化能力。

瓶頸不會消失,只是轉移到下一個環(huán)節(jié)。

3、AI實現(xiàn)完全的遞歸自我提升,開始自己造下一代自己。

這個場景下,AI的發(fā)展速度完全取決于算力了。人類退到監(jiān)督、驗證、審核的位置。

如果真的發(fā)生,這種能力大概率會遷移到其他科學領域,醫(yī)學、材料、能源,全線起飛。

當然,另一種未來,是對齊失敗。

這種情況下,偏差會在AI自我迭代的過程中逐步累積,最終——完全失控。

OMT

以上,便是Anthropic此次關于自進化,最關鍵的幾個觀點。

說實話,最開始我其實沒太當回事,畢竟Anthropic馬上就要IPO了,這一波不是典型的「Anthropic式」公關?

你別說,這次,可能真的有點不一樣。

因為就在幾天前,OpenAI也發(fā)布了類似的博客:

我們也在當今系統(tǒng)中看到自進化的早期跡象: AI的發(fā)展本身也被AI加速。
我們預計這將加劇開發(fā)商和國家之間的競爭壓力,并帶來現(xiàn)有機構無法應對的治理挑戰(zhàn)。
隨著RSI的出現(xiàn),社會需要方法塑造AI的發(fā)展軌跡 ,確保其服務于人類利益。



奇點,似乎來得比所有人預想的都要快。

博客:https://www.anthropic.com/institute/recursive-self-improvement

參考鏈接:
[1]https://x.com/kimmonismus/status/2062517474277675102
[2]https://x.com/anthropicai/status/2062568873321513443

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
馬斯克又驚人發(fā)言了,這次是關于日本的。

馬斯克又驚人發(fā)言了,這次是關于日本的。

果媽聊娛樂
2026-06-18 11:58:06
2016年,黎明和助理陳泳儀的合影,2年后,陳助理成了黎夫人

2016年,黎明和助理陳泳儀的合影,2年后,陳助理成了黎夫人

喜文多見01
2026-05-03 12:41:06
網友稱外賣吃出“帶血燒賣” 店員承認是自己的血但拒做檢查

網友稱外賣吃出“帶血燒賣” 店員承認是自己的血但拒做檢查

閃電新聞
2026-06-18 12:55:17
創(chuàng)造歷史,烏茲別克斯坦在隊史世界杯首秀打入隊史世界杯首球

創(chuàng)造歷史,烏茲別克斯坦在隊史世界杯首秀打入隊史世界杯首球

懂球帝
2026-06-18 11:54:28
呂特發(fā)表涉華言論,外交部駁斥

呂特發(fā)表涉華言論,外交部駁斥

可樂談情感
2026-06-18 18:50:47
14天的冷淡期已過!中國不再給機會,欺負海外中企的荷蘭要遭殃

14天的冷淡期已過!中國不再給機會,欺負海外中企的荷蘭要遭殃

他想要很多很多的夢
2026-06-12 05:32:19
知名演員無戲可拍,和母親街邊賣魚意外走紅,今選擇拍視頻當網紅

知名演員無戲可拍,和母親街邊賣魚意外走紅,今選擇拍視頻當網紅

白面書誏
2026-05-27 20:46:32
我40歲才醒悟:夫妻分開睡,男人忍耐的時間越久,就說明兩個問題

我40歲才醒悟:夫妻分開睡,男人忍耐的時間越久,就說明兩個問題

心理觀察局
2026-05-25 06:59:20
國乒女隊迎來新格局!22 歲草根黑馬逆襲上位

國乒女隊迎來新格局!22 歲草根黑馬逆襲上位

最愛乒乓球
2026-06-18 00:08:53
世界杯炸鍋!名宿怒噴葡萄牙王牌葬送全隊!隊友臉都黑了!

世界杯炸鍋!名宿怒噴葡萄牙王牌葬送全隊!隊友臉都黑了!

瀾歸序
2026-06-18 07:22:01
伊朗外長:任何對真主黨的襲擊,都將被視為違約

伊朗外長:任何對真主黨的襲擊,都將被視為違約

看看新聞Knews
2026-06-17 10:49:47
四個號,一家親:國際足聯(lián)把飯喂到嘴邊,國足用四個“零蛋”證明

四個號,一家親:國際足聯(lián)把飯喂到嘴邊,國足用四個“零蛋”證明

民間胡扯老哥
2026-06-11 10:34:23
套路真深?。‘惖啬猩s在女友生理期奔現(xiàn),坦言就是“想你了”

套路真深??!異地男生趕在女友生理期奔現(xiàn),坦言就是“想你了”

火山詩話
2026-06-16 06:44:57
辦世界杯竟成燙手山芋,2030年僅兩個申辦國,為啥沒人搶?

辦世界杯竟成燙手山芋,2030年僅兩個申辦國,為啥沒人搶?

嘆為觀止易
2026-06-08 14:22:53
37歲的大齡剩女參加相親,被大爺吐槽:三婚都不要你!

37歲的大齡剩女參加相親,被大爺吐槽:三婚都不要你!

塵埃里的看客
2026-06-16 15:12:32
女子烤魚店用餐時突發(fā)異物卡喉,男廚師光上身用海姆立克施救,被網友質疑不穿上衣貼近女性,本人回應:太突然了,身上原本還有燙傷

女子烤魚店用餐時突發(fā)異物卡喉,男廚師光上身用海姆立克施救,被網友質疑不穿上衣貼近女性,本人回應:太突然了,身上原本還有燙傷

大風新聞
2026-06-18 18:51:24
中國最有錢“村書記”,花1.2億為村民建326棟別墅,他錢從哪來?

中國最有錢“村書記”,花1.2億為村民建326棟別墅,他錢從哪來?

福建睿平
2026-06-18 07:32:13
3換1!野獸派大前鋒!雷霆最快速度交易

3換1!野獸派大前鋒!雷霆最快速度交易

籃球教學論壇
2026-06-18 18:40:13
20年前拒絕中國誠意,如今8天被打回原形,越南又一次遭遇暴擊!

20年前拒絕中國誠意,如今8天被打回原形,越南又一次遭遇暴擊!

近史博覽
2025-12-30 17:01:06
剛退位又當上領袖!菲律賓政壇上演回馬槍,九高官上訴最高院

剛退位又當上領袖!菲律賓政壇上演回馬槍,九高官上訴最高院

愛意隨風起呀
2026-06-18 16:09:53
2026-06-19 03:51:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12816文章數(shù) 176500關注度
往期回顧 全部

科技要聞

庫克承認扛不住了,蘋果漲價“不可避免”

頭條要聞

159瓶茅臺被扣3年后多瓶失蹤 警方:酒仍處于扣押時狀態(tài)

頭條要聞

159瓶茅臺被扣3年后多瓶失蹤 警方:酒仍處于扣押時狀態(tài)

體育要聞

英格蘭不再九子奪嫡,凱恩才是唯一真神

娛樂要聞

39歲梅西不愧是人生贏家!

財經要聞

博??礗PO,賺錢業(yè)務與資本敘事是兩門生意

汽車要聞

驚出冷汗!重慶實測奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

游戲
本地
手機
健康
公開課

PS5版《GTA6》已有店家開始預定!售價545元

本地新聞

世界杯黑馬佛得角:河北人開超市,溫州人當老板

手機要聞

iOS 27「查找」App升級:支持隱藏共享位置與自定義時長

吃粽子的3條保胃法則,消化科醫(yī)生推薦

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版