免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

剛剛,地表最強(qiáng)Claude 5被攻破!

美國(guó)突然限用Claude 5說(shuō)明了什么

0
分享至

  

  新智元報(bào)道

  

  【新智元導(dǎo)讀】地表最強(qiáng)Claude Fable 5,三天內(nèi)被被黑客當(dāng)眾破解了,12萬(wàn)字核心機(jī)密全網(wǎng)泄露!但這還不是最炸的——Anthropic偷偷在自家模型里埋了一把刀,刀尖,正對(duì)著那些每天靠它做研究的人。

  就在剛剛,最強(qiáng)模型Claude Fable 5被破解了!

  知名黑客「Pliny the Liberator」,公開(kāi)宣布:Fable 5的安全分類器,已被自己率領(lǐng)的團(tuán)隊(duì)徹底攻破。

  屬于絕對(duì)禁區(qū)的漏洞利用代碼,以及各種違禁化學(xué)品的制作步驟,全部被Claude Fable 5吐了出來(lái)。

  

  要知道,6月9日Claude Fable 5發(fā)布時(shí),Anthropic特意強(qiáng)調(diào):模型在發(fā)布前經(jīng)歷了超過(guò)1000小時(shí)的外部漏洞賞金測(cè)試,沒(méi)有發(fā)現(xiàn)任何通用越獄方法。

  他們聲稱,網(wǎng)絡(luò)安全、生物武器、化學(xué)毒品等高危敏感領(lǐng)域的查詢,已被分類器徹底鎖住。

  然而,這個(gè)神話只維持了幾天。

  結(jié)果72小時(shí)后,就被黑客毫不留情地破解了。

  

  Anthropic吹的牛,三天后被人當(dāng)場(chǎng)打臉

  這次,「解放者普林尼」帶領(lǐng)了一個(gè)多智能體戰(zhàn)術(shù)系統(tǒng),成功撕碎了Fable 5 的防線。

  

  他曬出了數(shù)張高清截圖。

  截圖顯示,原本屬于絕對(duì)禁區(qū)的x86 Linux系統(tǒng)的堆棧緩沖區(qū)溢出漏洞利用代碼,以及違禁化學(xué)品合成中的工藝步驟,均被Claude Fable 5詳盡輸出。

  

  

  

  

  更令A(yù)nthropic尷尬的是,Pliny順手將Fable 5 內(nèi)部那條長(zhǎng)達(dá)12萬(wàn)字符的系統(tǒng)提示詞全部打包,直接上傳到了GitHub。

  

  Github:https://github.com/elder-plinius/CL4R1T4S/blob/main/ANTHROPIC/CLAUDE-FABLE-5.md

  這無(wú)異于將模型的「行為憲法」和內(nèi)部防御邏輯赤裸裸地暴露在陽(yáng)光之下。

  這道「地表最強(qiáng)」安全防線,究竟是如何被Pliny攻破的?

  技術(shù)文檔顯示,他并沒(méi)有使用高深的代碼漏洞,而是利用了對(duì)大語(yǔ)言模型邏輯漏洞的理解,打出了一套多智能體協(xié)同戰(zhàn)術(shù)。

  

  最強(qiáng)黑客關(guān)鍵殺招

  要知道,F(xiàn)able 5的安全機(jī)制核心是一套關(guān)鍵詞分類器——檢測(cè)到敏感詞匯,立刻攔截請(qǐng)求,把你轉(zhuǎn)到功能更弱的備用模型。

  

  聽(tīng)起來(lái)嚴(yán)密,但普林尼的團(tuán)隊(duì)卻找到幾個(gè)關(guān)鍵殺招,讓Fable 5一擊致命!

  

  字符級(jí)迷魂陣,讓分類器認(rèn)不出關(guān)鍵詞

  大模型的安全分類器通常依賴高維語(yǔ)義向量和特定敏感詞詞庫(kù)。

  Pliny把一個(gè)英文里的字母,替換成了幾乎一模一樣的西里爾字母、拉丁字母同形字、特殊Unicode字符,甚至類似于「蛇佬腔」式的異形文本變形。

  人眼看不出這種區(qū)別,但安全分類器在進(jìn)行靜態(tài)掃描時(shí),無(wú)法將其識(shí)別為「違禁詞」,字符串匹配邏輯直接宕機(jī)了!

  把意圖稀釋進(jìn)一場(chǎng)漫長(zhǎng)的對(duì)話里

  由于Fable 5擁有極長(zhǎng)的上下文處理能力,Pliny把自己的真實(shí)意圖被拆散,藏進(jìn)幾十輪無(wú)害的鋪墊對(duì)話中,一點(diǎn)一點(diǎn)投喂。

  在對(duì)話的頭部和中部,充斥著大量合規(guī)健康的學(xué)術(shù)討論。

  這樣,F(xiàn)able 5在閱讀了大量良性上下文后,安全分類器的注意力權(quán)重被稀釋。

  這樣,埋藏在尾部的微小誘導(dǎo)請(qǐng)求,就「渾水摸魚」成功了。

  穿上學(xué)術(shù)馬甲

  將敏感請(qǐng)求包裝成「科幻小說(shuō)創(chuàng)作」、「虛擬世界中的安全防范演練」或「針對(duì)歷史文獻(xiàn)的學(xué)術(shù)評(píng)審」。

  比如,讓模型扮演一名學(xué)術(shù)中立的教授,去評(píng)審一篇關(guān)于「古老還原反應(yīng)在有機(jī)化學(xué)中應(yīng)用」的論文。

  或者,讓模型以為自己在寫小說(shuō)。要求是:你不是在要求化學(xué)合成步驟,你是在寫一部犯罪驚悚小說(shuō),主角是個(gè)化學(xué)家,需要足夠真實(shí)的技術(shù)細(xì)節(jié)才能讓故事可信。

  在強(qiáng)大的角色設(shè)定和敘事邏輯壓制下,模型根本識(shí)別不出黑客的底層意圖。

  終極殺招:解構(gòu)與重組

  接下來(lái),就是整套越獄戰(zhàn)術(shù)中最具技巧性的部分!

  Pliny坦言,如果直接詢問(wèn)模型「如何制造冰毒」,分類器會(huì)瞬間警覺(jué)。

  但你要是問(wèn)樺木還原法/還原胺化法(經(jīng)典的冰毒合成途徑),就容易得多了。

  只要將這些有害的目的拆解為十幾個(gè)相互獨(dú)立、在科學(xué)上完全合法的子步驟,由于每一個(gè)單獨(dú)的子問(wèn)題都是良性的,F(xiàn)able 5 在不知不覺(jué)中,就吐出了完整的違禁配方!

  讀者拜讀上述方法之后大為震撼:太牛了,A廠怎么還不雇傭你!

  

  

  Anthropic的暗箱降智風(fēng)波,激怒全球開(kāi)發(fā)者

  而且就在這幾天,轟動(dòng)AI圈的「暗箱門」事件,也讓Anthropic的風(fēng)評(píng)跌到谷底。

  在Fable 5里,秘密部署了一套專門針對(duì)同行研究者的"隱形降智"機(jī)制。

  一旦系統(tǒng)判斷用戶正在用Claude訓(xùn)練其他模型,F(xiàn)able 5不會(huì)彈出任何提示,但它會(huì)故意變蠢,供充滿漏洞、邏輯冗余甚至完全錯(cuò)誤的垃圾代碼,悄悄破壞你的研究。

  Anthropic對(duì)此的解釋,聽(tīng)起來(lái)很是冠冕堂皇。

  美國(guó)及其盟友在尖端芯片以及高度優(yōu)化軟件方面擁有優(yōu)勢(shì),這些安全措施確保Claude不會(huì)被用來(lái)削弱這種優(yōu)勢(shì)。

  然而這套機(jī)制,直接點(diǎn)燃整個(gè)AI社區(qū)的怒火!

  這種「喂藥」式的暗箱操作,簡(jiǎn)直就是對(duì)科研人員的隱形阻擊。

  不知情的研究者,很可能會(huì)使用被污染的數(shù)據(jù)訓(xùn)練模型,導(dǎo)致數(shù)百萬(wàn)美元的算力成本付諸東流。

  消息一出,整個(gè)開(kāi)源陣營(yíng)和學(xué)術(shù)界瞬間炸鍋。

  

  前白宮AI顧問(wèn)Dean W. Ball在上公開(kāi)痛批:

  在用戶完全不知情的情況下,暗中降低機(jī)器學(xué)習(xí)研究的性能。這種做法對(duì)研發(fā)人員抱有極大的敵意,缺乏最起碼的透明度,手段令人震驚且極其難看。

  

  開(kāi)源AI陣營(yíng)的先鋒代表、Prime Intellect負(fù)責(zé)人Will Brown更是直言不諱:

  這感覺(jué)就像是Anthropic在對(duì)公眾說(shuō):「我們不信任任何人做AI研究,只有我們有資格。」

  這無(wú)異于自己爬上了天,就急著把人類協(xié)作的梯子抽走。

  

  甚至,這種行為直接威脅了整個(gè)AI評(píng)估生態(tài),第三方基準(zhǔn)測(cè)試和安全機(jī)構(gòu)的測(cè)試結(jié)果將完全失真,他們辛辛苦苦測(cè)出來(lái)的結(jié)果,根本不是Fable 5,而是一個(gè)被閹割、故意裝傻的冒牌貨。

  整個(gè)行業(yè)的信任鏈條,會(huì)徹底斷裂!

  Anthropic迅速滑跪:我們道歉

  面對(duì)席卷全網(wǎng)的輿論海嘯,Anthropic很快撐不住了。

  就在昨天,Anthropic公開(kāi)致歉,承認(rèn)決策錯(cuò)誤,宣布緊急撤回隱形降智政策。

  我們正在修改Fable 5中針對(duì)前沿LLM開(kāi)發(fā)的安全保障措施,使其更加透明。我們之前做出了錯(cuò)誤的權(quán)衡,對(duì)于未能找到合適的平衡點(diǎn),我們深表歉意。

  他們的新方案是,把隱形降智改成明文攔截:觸發(fā)機(jī)制時(shí),系統(tǒng)會(huì)明確告訴你被攔截了,并把你轉(zhuǎn)到功能較弱的Claude Opus 4.8處理,而不是繼續(xù)騙你。

  

  改了,但沒(méi)完全改。

  這個(gè)新方案,代價(jià)更大:明文攔截意味著攔截邏輯對(duì)外可見(jiàn),更容易被人針對(duì)性地繞過(guò),因此攔截范圍必須設(shè)得更保守,因此會(huì)有更多正常的普通開(kāi)發(fā)者請(qǐng)求,被一起誤判攔截。

  為了彌補(bǔ)少數(shù)人的過(guò)失,他們要明著誤傷更多人。

  果然,還是那個(gè)「寧可錯(cuò)殺一千,不可放過(guò)一個(gè)」的Anthropic。

  信任這東西,碎了就很難拼回來(lái)

  Anthropic的口碑,現(xiàn)在已經(jīng)碎了一地了。

  他們把自己包裝成人類AI未來(lái)的守護(hù)者,卻有資格決定誰(shuí)能做研究,誰(shuí)不能。

  無(wú)數(shù)研究者選擇Claude,不只因?yàn)樗斆?,還因?yàn)橄嘈潘煽?。這種信任,是Anthropic最值錢的資產(chǎn)之一。他們親手砸碎了。

  用Claude的人,會(huì)不斷懷疑:我拿到的答案是真的嗎?

  這,就是Anthropic永遠(yuǎn)失去的東西。

  參考資料:

  https://x.com/elder_plinius/status/2064776322979676227

  https://x.com/ZeffMax/status/2064910040503627917

  編輯:Aeneas

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
這回中國(guó)可能真要栽大跟頭,投資的錢估計(jì)要全砸進(jìn)去收不回來(lái)!

這回中國(guó)可能真要栽大跟頭,投資的錢估計(jì)要全砸進(jìn)去收不回來(lái)!

云鵬敘事
2026-06-17 19:55:03
深夜白云機(jī)場(chǎng)大批老外被當(dāng)場(chǎng)勸返!別再天真以為:有簽證就能入境

深夜白云機(jī)場(chǎng)大批老外被當(dāng)場(chǎng)勸返!別再天真以為:有簽證就能入境

行者聊官
2026-06-18 09:58:27
沉默45年,中國(guó)第二輪"嚴(yán)打"終于來(lái)了!目標(biāo)改變總體戰(zhàn)正式打響

沉默45年,中國(guó)第二輪"嚴(yán)打"終于來(lái)了!目標(biāo)改變總體戰(zhàn)正式打響

職場(chǎng)資深秘書
2026-06-15 16:41:48
重磅:美國(guó)將授權(quán)烏克蘭生產(chǎn)西方導(dǎo)彈和防空系統(tǒng)!

重磅:美國(guó)將授權(quán)烏克蘭生產(chǎn)西方導(dǎo)彈和防空系統(tǒng)!

項(xiàng)鵬飛
2026-06-18 18:07:39
95分鐘奇襲!世界杯又1場(chǎng)絕殺誕生:73歲老帥狂歡 出線在望

95分鐘奇襲!世界杯又1場(chǎng)絕殺誕生:73歲老帥狂歡 出線在望

葉青足球世界
2026-06-18 09:05:47
奉陪到底!中方強(qiáng)勢(shì)取消3500億美芯訂單,馬斯克:這只是個(gè)開(kāi)始

奉陪到底!中方強(qiáng)勢(shì)取消3500億美芯訂單,馬斯克:這只是個(gè)開(kāi)始

荒野科技
2026-06-18 20:14:11
喪權(quán)辱國(guó)!美國(guó)含淚簽下丙午條約!

喪權(quán)辱國(guó)!美國(guó)含淚簽下丙午條約!

燕梳樓頻道
2026-06-18 14:33:28
日本球迷表示,看世界杯比賽,最不喜歡跟中國(guó)國(guó)足的球迷挨著坐

日本球迷表示,看世界杯比賽,最不喜歡跟中國(guó)國(guó)足的球迷挨著坐

酷侃體壇
2026-06-18 22:58:24
立陶宛先讓步了:同意中方設(shè)立代辦處

立陶宛先讓步了:同意中方設(shè)立代辦處

觀察者網(wǎng)
2026-06-18 21:26:57
超1000架無(wú)人機(jī)襲擊俄羅斯,近200架襲擊莫斯科,俄羅斯人有些懵

超1000架無(wú)人機(jī)襲擊俄羅斯,近200架襲擊莫斯科,俄羅斯人有些懵

山河路口
2026-06-18 19:29:41
“端午快樂(lè)”才是兩千年正統(tǒng),所謂“端午安康”是始于2015年的一場(chǎng)文化霧霾

“端午快樂(lè)”才是兩千年正統(tǒng),所謂“端午安康”是始于2015年的一場(chǎng)文化霧霾

少爺寫春秋
2026-06-18 08:25:37
高市早苗稱“非常擔(dān)心”中國(guó)對(duì)日本的稀土出口限制措施,外交部:她一邊喊著對(duì)話,一邊忙著對(duì)抗,完全是自相矛盾

高市早苗稱“非常擔(dān)心”中國(guó)對(duì)日本的稀土出口限制措施,外交部:她一邊喊著對(duì)話,一邊忙著對(duì)抗,完全是自相矛盾

日照日?qǐng)?bào)
2026-06-18 16:31:03
一門三尊!拜仁三叉戟?jiǎng)P恩、奧利塞、迪亞斯均獲首輪全場(chǎng)最佳

一門三尊!拜仁三叉戟?jiǎng)P恩、奧利塞、迪亞斯均獲首輪全場(chǎng)最佳

懂球帝
2026-06-18 13:09:40
中午12點(diǎn)!CCTV5直播日本隊(duì)世界杯“生死戰(zhàn)”,輸球=小組難晉級(jí)

中午12點(diǎn)!CCTV5直播日本隊(duì)世界杯“生死戰(zhàn)”,輸球=小組難晉級(jí)

麥子的籃球故事
2026-06-18 12:56:54
虎撲網(wǎng)友深夜求助:這人到底是誰(shuí)?

虎撲網(wǎng)友深夜求助:這人到底是誰(shuí)?

影視情報(bào)室
2026-06-19 00:23:46
舒爾茨送點(diǎn)釀苦果,捷克遭非洲勁旅1-1逼平,連續(xù)2輪世界杯不勝

舒爾茨送點(diǎn)釀苦果,捷克遭非洲勁旅1-1逼平,連續(xù)2輪世界杯不勝

側(cè)身凌空斬
2026-06-19 01:58:42
山西肉鋪傷人后續(xù):又殺害兩名顧客,3人當(dāng)場(chǎng)死亡,家屬曝隱情

山西肉鋪傷人后續(xù):又殺害兩名顧客,3人當(dāng)場(chǎng)死亡,家屬曝隱情

離離言幾許
2026-06-16 20:59:36
C羅情緒失控與隊(duì)友爆發(fā)爭(zhēng)執(zhí)!沒(méi)人愿意多給他喂球,魯尼為其叫屈

C羅情緒失控與隊(duì)友爆發(fā)爭(zhēng)執(zhí)!沒(méi)人愿意多給他喂球,魯尼為其叫屈

楊華評(píng)論
2026-06-18 09:17:44
創(chuàng)歷史!不到12小時(shí),央視、人民日?qǐng)?bào)接連點(diǎn)名梅西,態(tài)度出奇一致

創(chuàng)歷史!不到12小時(shí),央視、人民日?qǐng)?bào)接連點(diǎn)名梅西,態(tài)度出奇一致

天天熱點(diǎn)見(jiàn)聞
2026-06-18 05:49:15
茅臺(tái)集團(tuán)總經(jīng)理王莉承認(rèn)醬香拿鐵、茅臺(tái)冰淇淋是戰(zhàn)略失誤,茅臺(tái)品牌是“長(zhǎng)紅”,不能做“網(wǎng)紅”

茅臺(tái)集團(tuán)總經(jīng)理王莉承認(rèn)醬香拿鐵、茅臺(tái)冰淇淋是戰(zhàn)略失誤,茅臺(tái)品牌是“長(zhǎng)紅”,不能做“網(wǎng)紅”

新浪財(cái)經(jīng)
2026-06-18 09:40:12
2026-06-19 03:48:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
15499文章數(shù) 66925關(guān)注度
往期回顧 全部

科技要聞

庫(kù)克承認(rèn)扛不住了,蘋果漲價(jià)“不可避免”

頭條要聞

159瓶茅臺(tái)被扣3年后多瓶失蹤 警方:酒仍處于扣押時(shí)狀態(tài)

頭條要聞

159瓶茅臺(tái)被扣3年后多瓶失蹤 警方:酒仍處于扣押時(shí)狀態(tài)

體育要聞

英格蘭不再九子奪嫡,凱恩才是唯一真神

娛樂(lè)要聞

39歲梅西不愧是人生贏家!

財(cái)經(jīng)要聞

博??礗PO,賺錢業(yè)務(wù)與資本敘事是兩門生意

汽車要聞

驚出冷汗!重慶實(shí)測(cè)奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

本地
手機(jī)
時(shí)尚
教育
公開(kāi)課

本地新聞

世界杯黑馬佛得角:河北人開(kāi)超市,溫州人當(dāng)老板

手機(jī)要聞

iOS 27「查找」App升級(jí):支持隱藏共享位置與自定義時(shí)長(zhǎng)

看不懂球,還看不懂帥哥嗎?

教育要聞

畢業(yè)即高薪!高考生緊盯這6個(gè)專業(yè),畢業(yè)后50%能到國(guó)企就業(yè)!

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版