免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Fable 5一天干完兩個(gè)月,這類工程師更值錢了

0
分享至


新智元報(bào)道


【新智元導(dǎo)讀】Fable 5發(fā)布后,Claude Code團(tuán)隊(duì)說,他們不再驗(yàn)證Claude有沒有把活干對(duì),而是開始驗(yàn)證它有沒有在干對(duì)的事。開發(fā)者開始從盯代碼輸出的監(jiān)工,轉(zhuǎn)變?yōu)槎?biāo)準(zhǔn)的產(chǎn)品經(jīng)理,衡量優(yōu)秀工程師的標(biāo)準(zhǔn)也隨之變了。

一夜之間,全網(wǎng)被一張由飛舞蝴蝶拼成的「5」字刷屏了。

這張圖的主角,正是Anthropic剛端出的最強(qiáng)模型——Claude Fable 5。


https://www.anthropic.com/news/claude-fable-5-mythos-5

Anthropic官宣,這是他們第一款為通用場(chǎng)景做好安全處理的Mythos級(jí)模型,能力超過此前公開發(fā)布的任何一款。


緊接著,官方又公布了將所有用戶的5小時(shí)和每周速率限制全部清零,讓大家「盡情享受Fable 5」。

開發(fā)者這邊,也一夜變天。

用Claude Code團(tuán)隊(duì)自己的話說:過去,他們盯的是Claude有沒有正確完成工作;現(xiàn)在,他們盯的是Claude有沒有在做正確的事。

Claude Code團(tuán)隊(duì)成員Thariq Shihipar認(rèn)為,F(xiàn)able是模型領(lǐng)域的一次重大突破,將改變?nèi)藗兣cClaude的協(xié)作方式,有了這樣的利器加持,「是時(shí)候更有雄心了」。


Thariq是AskUserQuestion工具的作者。這個(gè)工具的功能,就是讓AI反過來采訪你:動(dòng)手寫代碼前,先拋一串選擇題,把實(shí)現(xiàn)細(xì)節(jié)、邊界情況、取舍問清楚。模型能自己跑得越久,這種事先問清楚的能力就越重要。

Thariq也分享了團(tuán)隊(duì)總結(jié)的Fable 5所帶來的變化——

三件事被改寫了:你怎么給它交代任務(wù)、你怎么驗(yàn)收它、你一個(gè)人能同時(shí)指揮多少個(gè)它。

先看Anthropic發(fā)布文中的Stripe案例:5000萬行Ruby代碼庫全庫遷移,人工需兩個(gè)多月,F(xiàn)able 5一天完成。


一個(gè)5000萬行的Ruby代碼庫,要做全庫遷移,按人手算,一個(gè)團(tuán)隊(duì)得干兩個(gè)多月,F(xiàn)able 5用了一天

把兩個(gè)多月壓成一天,這已經(jīng)不是提速那么簡單,人與AI的分工又一次被重新定義了。

從盯過程的監(jiān)工

到定標(biāo)準(zhǔn)的產(chǎn)品經(jīng)理

這輪升級(jí)的焦點(diǎn),并不是跑分。

Anthropic給Claude Code的定位是「智能體編程環(huán)境(agentic coding environment)」。

它能讀文件、跑命令、改代碼,在你盯著、打斷、或者干脆離開的時(shí)候,自己把問題推進(jìn)下去。

這才是關(guān)鍵:它能自己干活了你還盯什么?Claude Code官方最佳實(shí)踐里提到這樣一句話:

如果你不給Claude一個(gè)能跑的檢查項(xiàng),那你自己就會(huì)變成那個(gè)驗(yàn)證循環(huán)。每一個(gè)錯(cuò)誤,都得等你親眼發(fā)現(xiàn)。


Claude Code官方最佳實(shí)踐:給Claude一個(gè)能跑的檢查,測(cè)試、構(gòu)建或截圖對(duì)比,否則你自己就成了驗(yàn)證循環(huán)

意思是說,過去你是監(jiān)工,蹲在屏幕前看它一步步寫,寫錯(cuò)一行改一行?,F(xiàn)在不一樣了。你的活,從「逐步指揮」變成了「定義目標(biāo)、給夠上下文、立好驗(yàn)收標(biāo)準(zhǔn)」。

「給目標(biāo)、給上下文」聽起來不復(fù)雜,落地卻不容易,官方最佳實(shí)踐也給出了方向。

別一上來就讓它寫代碼,先讓它探索、再讓它計(jì)劃、最后才動(dòng)手,免得它埋頭解決了一個(gè)錯(cuò)的問題。

還有關(guān)鍵一點(diǎn):用剛才提到的AskUserQuestion,讓Claude先反過來采訪你,把你沒想清楚的實(shí)現(xiàn)細(xì)節(jié)、邊界情況、取舍一條條問出來,最后落成一份SPEC.md。

不要擔(dān)心這些準(zhǔn)備工作浪費(fèi)時(shí)間。當(dāng)模型能力足夠強(qiáng),能夠自主干活,把需求說清楚,比你盯著它寫代碼就要值錢得多了。

這正是Claude Code團(tuán)隊(duì)身上發(fā)生的事:從以前驗(yàn)證Claude有沒有做對(duì)事情,到現(xiàn)在驗(yàn)證它有沒有在做對(duì)的事情。

放手很爽

如何才能信任

放手聽起來很爽,但憑什么信任Claude?

它最讓人頭疼的一點(diǎn),是錯(cuò)了還一臉篤定。而且模型越強(qiáng),輸出越像模像樣,錯(cuò)起來越難被一眼看穿。

Claude會(huì)在「看起來做完了」的時(shí)候停下來,可這恰恰是最危險(xiǎn)的信號(hào)。

沒有一個(gè)能跑的檢查,「看起來完成」就成了Claude唯一的判斷依據(jù),到頭來可能就成了你的麻煩。

官方的解法是:給它一個(gè)能判斷「通過」或「失敗」的東西。

比如一套測(cè)試、一個(gè)構(gòu)建的退出碼、一段把結(jié)果和設(shè)計(jì)稿做對(duì)比的截圖。它干活、跑檢查、讀結(jié)果、再改,直到檢查通過。這個(gè)循環(huán)自己就閉環(huán)了。

更進(jìn)一步,是Claude Code里的/goal。你設(shè)一個(gè)完成條件,它就跨輪次一直干,不用你一輪輪去催。

每干完一輪,會(huì)有另一個(gè)小模型出來打分:它不是干活那個(gè)Claude,而是一個(gè)更小更快、更便宜的模型(默認(rèn)是Haiku),專門讀一遍完成條件和這輪對(duì)話,判一句「達(dá)成」還是「沒達(dá)成」,再附一句理由。沒達(dá)成就接著干,達(dá)成了自動(dòng)收工。


Claude Code的/goal命令:設(shè)好完成條件,每輪由一個(gè)小模型判斷是否達(dá)成,沒達(dá)成就繼續(xù)干

看上去像無人駕駛。但有一點(diǎn)必須講清楚:那個(gè)打分的小模型,不會(huì)自己去跑命令,也不會(huì)自己去讀文件,它只能看Claude在對(duì)話里擺出來的證據(jù)。

也就是說,這套循環(huán)轉(zhuǎn)得順不順,全看Claude有沒有把真東西擺出來。條件寫得松一點(diǎn),或者Claude只是嘴上說「跑過了」,評(píng)估器照樣可能通過。

所以自檢交付不等于無人審稿。

敢放手,靠的是隨時(shí)能看到證據(jù),不是賭模型聰明。

一個(gè)人

開始指揮上百個(gè)智能體

如果說/goal是讓一個(gè)Claude干得更久,那Dynamic workflows是讓一群Claude一起干。

它的玩法是,Claude替你寫一段JavaScript腳本,這段腳本去編排大量子智能體在后臺(tái)跑。

官方給的適用場(chǎng)景有全庫的代碼審計(jì)、500個(gè)文件的大遷移、需要交叉驗(yàn)證的研究問題等。

運(yùn)行規(guī)模有多大?一次運(yùn)行最多能調(diào)動(dòng)1000個(gè)智能體,同時(shí)并發(fā)最多16個(gè)。


Claude Code官方文檔的workflows約束表,高亮處顯示單次運(yùn)行最多1000個(gè)智能體

Claude Code甚至內(nèi)置了一個(gè)叫/deep-research的workflow,專門把一個(gè)問題拆成多個(gè)角度去搜、去交叉核驗(yàn)、再投票篩掉站不住的說法,最后給你一份帶引用的報(bào)告。

這意味著什么?Claude Code已經(jīng)不只是終端里那個(gè)陪你聊天的對(duì)話框了,它在向一個(gè)能持續(xù)運(yùn)行、能編排、能復(fù)用的工程代理系統(tǒng)靠攏。

一個(gè)人指揮一支AI軍團(tuán),現(xiàn)在只用/workflows里的一行命令就能辦到。

自主不等于替代

Fable 5確實(shí)更強(qiáng)。

官方說它能比此前任何Claude模型更長時(shí)間自主工作,任務(wù)越長越復(fù)雜,它領(lǐng)先得越多,但這不等于程序員完全可以撒手不管了。

恰恰相反,官方最佳實(shí)踐通篇在強(qiáng)調(diào)四件必須要交給人去干的活:定驗(yàn)證標(biāo)準(zhǔn)、管權(quán)限、控上下文、審證據(jù)。


它甚至專門列出了一些應(yīng)當(dāng)避免的常見失敗模式,其中一類錯(cuò)誤叫「信任但不驗(yàn)證的缺口」(The trust-then-verify gap),說的正是Claude給出一份看著像模像樣、實(shí)則沒處理邊界的情況。

解法只有一個(gè):你能驗(yàn)證它,才能發(fā)布它;驗(yàn)證不了,就別發(fā)布。

成本和門檻,也繞不過去。

Fable 5的價(jià)格是每百萬輸入token 10美元、每百萬輸出token 50美元。能力更猛的「孿生兄弟」Mythos 5,底層是同一個(gè)模型,只是放寬了部分安全保護(hù),眼下只開放給一小部分網(wǎng)絡(luò)防御者和基礎(chǔ)設(shè)施提供方。

Fable 5本身還帶著一層分類器護(hù)欄。

碰到網(wǎng)絡(luò)安全、生物化學(xué)這類敏感話題,它會(huì)自動(dòng)把回答交給Opus 4.8接管。官方說超過95.0%的會(huì)話不會(huì)觸發(fā)這種回退,但護(hù)欄調(diào)得偏保守,偶爾也可能誤傷正常請(qǐng)求。

敢接長任務(wù),不等于敢完全撒手。越自主,越要會(huì)驗(yàn)收。

回到Thariq那句話:是時(shí)候更有雄心了。

這個(gè)雄心背后的潛臺(tái)詞是讓你敢把更大的問題交出去。但放手的過程還要有掌控,這更像是一種融合了經(jīng)驗(yàn)與直覺的藝術(shù)。

規(guī)則是起點(diǎn)

不是教條

說了這么多規(guī)則和方法后,Anthropic官方補(bǔ)了一條:它們?nèi)瞧瘘c(diǎn),不是教條。

也就是說,這套最佳實(shí)踐在多數(shù)情況下好用,卻未必適合每個(gè)場(chǎng)景。

有時(shí)候,你該讓上下文一直攢著,因?yàn)槟阏幸粋€(gè)復(fù)雜問題,那段歷史很重要;有時(shí)候,你該跳過計(jì)劃直接讓Claude上,因?yàn)槿蝿?wù)本就是探索性的;有時(shí)候,一句含糊的提示恰恰是對(duì)的,因?yàn)槟阆胂瓤纯此趺蠢斫猓贈(zèng)Q定要不要框住它。

訣竅是留心什么管用,沒有一定之規(guī)。

Claude干得漂亮?xí)r,回想你做了什么:提示怎么寫的、給了哪些上下文、用的哪個(gè)模式;它卡殼時(shí),反思一下:提示太空、任務(wù)一口吃不下?

慢慢地,你會(huì)長出一種沒有任何指南可以教的直覺:什么時(shí)候該說細(xì)、什么時(shí)候該留白;什么時(shí)候該計(jì)劃、什么時(shí)候該放它去探索——

到了那一步,你才算真懂了怎么和它一起干活。

當(dāng)Fable 5能把兩個(gè)多月的活一天干完之后,程序員最稀缺的能力已經(jīng)變了:不再是把代碼寫好,而是定義什么才是好代碼,「會(huì)編程」這件事的定義,也在被悄悄改寫。

未來最值錢的工程師,不再是代碼監(jiān)工,而是那個(gè)最會(huì)提問、定標(biāo)準(zhǔn)、驗(yàn)收的人。

參考資料:

https://www.anthropic.com/news/claude-fable-5-mythos-5%20%20

https://code.claude.com/docs/en/best-practices%20

https://code.claude.com/docs/en/common-workflows%20

https://x.com/ClaudeDevs/status/2064399512664526853

編輯:元宇

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
B費(fèi)社媒遭攻陷:自私+故意不傳球!怕C羅世界杯發(fā)光 總裁親姐點(diǎn)贊

B費(fèi)社媒遭攻陷:自私+故意不傳球!怕C羅世界杯發(fā)光 總裁親姐點(diǎn)贊

我愛英超
2026-06-18 21:36:54
高市早苗稱“非常擔(dān)心”中國對(duì)日本的稀土出口限制措施,外交部:她一邊喊著對(duì)話,一邊忙著對(duì)抗,完全是自相矛盾

高市早苗稱“非常擔(dān)心”中國對(duì)日本的稀土出口限制措施,外交部:她一邊喊著對(duì)話,一邊忙著對(duì)抗,完全是自相矛盾

日照日?qǐng)?bào)
2026-06-18 16:31:03
安徽情侶自駕3.5萬公里旅行結(jié)婚,耗時(shí)100天經(jīng)17省市,“囍”字寫滿陌生人祝福

安徽情侶自駕3.5萬公里旅行結(jié)婚,耗時(shí)100天經(jīng)17省市,“囍”字寫滿陌生人祝福

瀟湘晨報(bào)
2026-06-18 17:41:20
成品油價(jià)降回7元時(shí)代

成品油價(jià)降回7元時(shí)代

界面新聞
2026-06-18 15:01:31
鄭欽文排名斷崖式下跌:資本迅速撤離,曾經(jīng)追捧她的品牌去哪了

鄭欽文排名斷崖式下跌:資本迅速撤離,曾經(jīng)追捧她的品牌去哪了

財(cái)經(jīng)保探長
2026-06-18 23:35:15
世界杯開戰(zhàn)一周,青島啤酒先扛不住了

世界杯開戰(zhàn)一周,青島啤酒先扛不住了

金角財(cái)經(jīng)
2026-06-18 15:54:28
亨利:葡萄牙需要的是進(jìn)球,C羅擋住了B費(fèi)的必進(jìn)球

亨利:葡萄牙需要的是進(jìn)球,C羅擋住了B費(fèi)的必進(jìn)球

懂球帝
2026-06-18 15:06:15
梁文鋒為什么選了劉強(qiáng)東,沒選馬云?

梁文鋒為什么選了劉強(qiáng)東,沒選馬云?

帥真商業(yè)
2026-06-18 10:20:26
網(wǎng)曝蘇州企業(yè)把工人換成印度人!工資僅國人的一半,福利待遇很好

網(wǎng)曝蘇州企業(yè)把工人換成印度人!工資僅國人的一半,福利待遇很好

小徐講八卦
2026-06-18 19:24:00
哥倫比亞3比1戰(zhàn)勝烏茲別克斯坦,力壓葡萄牙暫列小組第一

哥倫比亞3比1戰(zhàn)勝烏茲別克斯坦,力壓葡萄牙暫列小組第一

澎湃新聞
2026-06-18 12:04:31
1-1!捷克隊(duì)保守付代價(jià),南非隊(duì)點(diǎn)球絕平,兩隊(duì)菜雞互啄都走不遠(yuǎn)

1-1!捷克隊(duì)保守付代價(jià),南非隊(duì)點(diǎn)球絕平,兩隊(duì)菜雞互啄都走不遠(yuǎn)

硬腿子聊個(gè)球
2026-06-19 01:58:44
奉陪到底!中方強(qiáng)勢(shì)取消3500億美芯訂單,馬斯克:這只是個(gè)開始

奉陪到底!中方強(qiáng)勢(shì)取消3500億美芯訂單,馬斯克:這只是個(gè)開始

荒野科技
2026-06-18 20:14:11
羅翔說:電視上演的都是,給你多少萬,離開我女兒;而現(xiàn)實(shí)中卻是,給我們多少萬,否則離開我女兒

羅翔說:電視上演的都是,給你多少萬,離開我女兒;而現(xiàn)實(shí)中卻是,給我們多少萬,否則離開我女兒

背包旅行
2026-06-18 14:23:32
沉默45年,中國第二輪"嚴(yán)打"終于來了!目標(biāo)改變總體戰(zhàn)正式打響

沉默45年,中國第二輪"嚴(yán)打"終于來了!目標(biāo)改變總體戰(zhàn)正式打響

職場(chǎng)資深秘書
2026-06-15 16:41:48
深夜白云機(jī)場(chǎng)大批老外被當(dāng)場(chǎng)勸返!別再天真以為:有簽證就能入境

深夜白云機(jī)場(chǎng)大批老外被當(dāng)場(chǎng)勸返!別再天真以為:有簽證就能入境

行者聊官
2026-06-18 09:58:27
SpaceX,股價(jià)大跌

SpaceX,股價(jià)大跌

澎湃新聞
2026-06-19 01:02:18
乘坐飛機(jī),發(fā)現(xiàn)一個(gè)空姐很像豆包,蚌埠住了。

乘坐飛機(jī),發(fā)現(xiàn)一個(gè)空姐很像豆包,蚌埠住了。

微微熱評(píng)
2026-06-18 12:42:56
韓媒:韓國足壇的奇恥大辱——中國足球裁判時(shí)隔24年擔(dān)任世界杯主裁

韓媒:韓國足壇的奇恥大辱——中國足球裁判時(shí)隔24年擔(dān)任世界杯主裁

寶哥精彩賽事
2026-06-18 10:24:39
某高考生自曝提前10天知曉成績,被質(zhì)疑后放話:我爸是教育局的

某高考生自曝提前10天知曉成績,被質(zhì)疑后放話:我爸是教育局的

西虹市閑話
2026-06-18 17:28:27
轟動(dòng)全網(wǎng)的北京“退衣姐”被刑拘事件:我們還是低估了這群人的不要臉

轟動(dòng)全網(wǎng)的北京“退衣姐”被刑拘事件:我們還是低估了這群人的不要臉

桌子的生活觀
2026-06-18 12:30:11
2026-06-19 03:52:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
15499文章數(shù) 66925關(guān)注度
往期回顧 全部

科技要聞

庫克承認(rèn)扛不住了,蘋果漲價(jià)“不可避免”

頭條要聞

159瓶茅臺(tái)被扣3年后多瓶失蹤 警方:酒仍處于扣押時(shí)狀態(tài)

頭條要聞

159瓶茅臺(tái)被扣3年后多瓶失蹤 警方:酒仍處于扣押時(shí)狀態(tài)

體育要聞

英格蘭不再九子奪嫡,凱恩才是唯一真神

娛樂要聞

39歲梅西不愧是人生贏家!

財(cái)經(jīng)要聞

博??礗PO,賺錢業(yè)務(wù)與資本敘事是兩門生意

汽車要聞

驚出冷汗!重慶實(shí)測(cè)奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

時(shí)尚
藝術(shù)
旅游
健康
家居

看不懂球,還看不懂帥哥嗎?

藝術(shù)要聞

臺(tái)北東區(qū)新門戶!南港雙星,像一道“城市裂痕”

旅游要聞

為何拍藍(lán)花楹別正午出門?避開 3 個(gè)高峰時(shí)段,隨手拍出干凈大片!

吃粽子的3條保胃法則,消化科醫(yī)生推薦

家居要聞

綠意盎然 自然之境

無障礙瀏覽 進(jìn)入關(guān)懷版