免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網易首頁 > 網易號 > 正文 申請入駐

Claude Fable 5省錢秘訣來了:調成Low檔比Opus更便宜

0
分享至

henry 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

聰明人總能花最少的錢辦最好的事,AI也一樣。

就在大伙還在為Claude Fable 5兩倍于Opus 4.8的token單價發(fā)愁時,反轉來了——

不少開發(fā)者發(fā)現,把Fable 5的努力程度(effort)調到最低的low檔之后,模型不僅沒變弱,反而變得格外能打,token消耗也著實少了。



而且哪怕是最低檔位,它在SWE-bench Pro上的得分依然壓過Opus 4.8開到最強xhigh檔的成績——75.0對68.6。



(注:系統卡這組數據出自Mythos 5配置。Fable 5是加了安全分類器的公開版本,兩者權重相同,編碼任務基本不觸發(fā)分類器)

不過,開low檔省錢用好模型還只是故事的一半。

因為過去一天里,不少人發(fā)現,Fable 5的省錢未必只是因為開了low檔。

在一些實際任務中,它甚至能做到效果更好、速度更快,最后賬單還更便宜。



比如在GameBench的測試里,面對同一個蜘蛛吃蟲子的小游戲任務,Fable 5不僅生成速度更快,效果也更好,而最終成本反而低于Opus 4.8。

(左邊為Fable 5,右邊為Opus 4.8)

這下。事情就有意思了。

原本大家還在糾結Fable 5貴了一倍,現在卻發(fā)現,它不僅更強,很多時候甚至還更省。

貴是貴在單價上,省卻省在最后的賬單上,Fable5 low啟動!



貴的模型怎么更省錢

那么,為啥明明更貴的模型反而更省錢呢?

畢竟,Fable定價每百萬輸入token 10美元、輸出50美元,剛好是上一代旗艦Opus 4.8(5美元/25美元)的兩倍。



對此,Claude Code之父Boris Cherny在Threads上解釋了這筆賬:

Fable每token的價格確實是Opus的兩倍,但完成同一個任務平均用的token更少,因為它更聰明、更高效,在一些復雜任務上,Fable的實際花費反而低于Opus。



評論區(qū)也有網友表達了類似觀點:

目前觀察到的就是這樣,單任務token更少,糾錯動作更少,浪費的token也就更少。



換句話說,以前那些不夠聰明的Agent,總會在寫錯了再改、跑掛了重跑的過程中瘋狂燒token。

模型越笨,犯錯次數越多,你就得多付一輪token的錢。

而Fable 5砍掉的,恰恰就是這部分隱性成本。

比如,Fable 5在shortcut的電子表格任務測試中,Fable 5在所有effort檔位都跑贏了Opus 4.8,不僅回合數更少,整體完成速度還快了25%~30%。



再比如物理研究那條案例。

署名為Matthew Pines(CEO)的研究者表示,Fable 5是他們測過最強的前沿物理研究模型,僅用三分之一的推理token,就在36小時內跑到了GPT-5.5需要四天才能接近的位置。



當然,Fable比Opus更省更好也不是絕對的,具體還得看任務類型。

Reddit上也有網友反饋,在某些特定任務里,Fable確實會消耗更多token,但并沒有外界想象得那么夸張,很大程度上取決于上下文長度和任務規(guī)模。

如果任務本身不復雜,其他effort檔位甚至其他模型,也完全夠用。



其實官方公告里也悄悄提到了這一點。



Anthropic在發(fā)布文章中提到,Fable 5相比以往Claude模型擁有更高的token效率。

他們給出的證據來自Cognition的FrontierCode評測。這套評測考察的是模型能否在達到生產級代碼標準的前提下完成高難度任務,而Fable 5僅在medium檔位,就已經拿下了所有前沿模型中的第一名。



所以,這套定價的正確打開方式或許不是看每token多少錢,而是看每干完一個活多少錢。

按前者算,Fable 5確實貴了一倍。

但按后者算,在足夠復雜的任務上,它甚至可能比Opus還便宜。

不僅省,榜單這一塊也被Fable 5掃完了

如果說更低的任務成本還屬于見仁見智,那么過去一天多時間里各家評測榜單給出的結果就比較直接了:

Fable 5幾乎把能拿的第一都拿了一遍。

先看綜合能力。

在Artificial Analysis最新的智能指數中,Fable 5以64.9分排名第一,領先GPT-5.5約5分,榜單前兩名全部被Anthropic包攬。



在人類最后的測試(Humanity’s Last Exam)上,Fable 5拿到53%的成績,比第二名高出7個百分點以上。



再看Agent能力。

在arena.ai的Agent榜單上,Fable 5登頂榜首。



文本處理、網頁開發(fā)等場景依舊保持領先。



在FrontierCode上也是第一。



SimpleBench上的表現則已經逼近人類水平。



除此之外,編程能力可能是爭議最小的一項。

拋開Anthropic自己的數據之外,第三方評測機構TrueFoundry公布的結果顯示,在SWE-Bench Pro上,Fable 5以80.3%的成績拿到所有受測模型中的最高分,GPT-5.5在這一項上落后超過21個百分點。



Every的評測文章則給出了一個更直觀的數字。

在他們最難的Senior Engineer基準測試中,Fable 5獲得91分(滿分100分),已經接近參與測試的人類資深工程師水平區(qū)間;作為對比,Opus 4.8得63分,GPT-5.5得62分。

One more thing

不過,在把Fable 5默認調成low檔之前,還有兩件事值得注意。

第一,Fable 5帶著安全分類器上線。

涉及網絡安全、生物化學、模型蒸餾等敏感請求時,系統會自動切換到Opus 4.8回答,并按照Opus價格計費。Anthropic表示,這類情況觸發(fā)率不到5%的會話。

這也意味著,部分安全相關Benchmark上的成績,公開版本未必能夠完全復現。

第二,當前的免費使用窗口是限時的。

6月22日之前,Pro、Max、Team以及按席位計費的企業(yè)版用戶都可以直接使用Fable 5;從6月23日起,將開始消耗用量積分。Anthropic表示,等算力容量跟上之后,會重新恢復為訂閱權益。

另外,使用Fable 5需要開啟30天數據保留,以滿足安全監(jiān)控要求。


[1]https://game-bench.piccini.app/
[2]https://www.threads.com/@boris_cherny/post/DZYShwtkiJS/fable-is-x-as-expensive-as-opus-per-token-but-uses-less-tokens-on-average-to-do/
[3]https://arena.ai/leaderboard

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
“初中女生壞起來比男孩更可怕”,班主任曝內情:三觀都被刷新了

“初中女生壞起來比男孩更可怕”,班主任曝內情:三觀都被刷新了

澤澤先生
2026-06-18 19:58:44
剛退位又當上領袖!菲律賓政壇上演回馬槍,九高官上訴最高院

剛退位又當上領袖!菲律賓政壇上演回馬槍,九高官上訴最高院

愛意隨風起呀
2026-06-18 16:09:53
身體兩處“發(fā)癢”,別誤以為是過敏,可能是肝癌的“提示信號”

身體兩處“發(fā)癢”,別誤以為是過敏,可能是肝癌的“提示信號”

熊貓醫(yī)學社
2026-06-17 11:35:03
高位截癱桑蘭44歲賭命生二胎,丈夫怒拒:她總想贏,我只想她活著

高位截癱桑蘭44歲賭命生二胎,丈夫怒拒:她總想贏,我只想她活著

情感大頭說說
2026-06-19 04:15:50
多名院士呼吁快停止食用,吃一口等于14斤塑料袋,女子因腎衰走了

多名院士呼吁快停止食用,吃一口等于14斤塑料袋,女子因腎衰走了

健康科普365
2026-06-13 19:20:05
曹德旺交卷了!福耀科技大學憑硬實力出圈,傳統高校該反思了

曹德旺交卷了!福耀科技大學憑硬實力出圈,傳統高校該反思了

復轉這些年
2026-06-15 18:49:23
“摸奶子”再惹爭議,OPPO的流量反噬開始了

“摸奶子”再惹爭議,OPPO的流量反噬開始了

品牌頭版
2026-05-13 10:18:15
4-2!贏了克羅地亞不可怕,可怕的是圖赫爾的發(fā)言,學到不少東西

4-2!贏了克羅地亞不可怕,可怕的是圖赫爾的發(fā)言,學到不少東西

生活新鮮市
2026-06-18 12:03:33
超模艾米麗透視紅裙火上熱搜,這波操作比衣服還精彩?

超模艾米麗透視紅裙火上熱搜,這波操作比衣服還精彩?

生活觀察員啊
2026-06-18 00:08:48
為什么大獲全勝的殲-10賣不出去,一敗涂地的陣風卻銷量火爆?

為什么大獲全勝的殲-10賣不出去,一敗涂地的陣風卻銷量火爆?

基斯默默
2026-05-28 11:06:03
太平島禁區(qū)守了幾十年,為何12分鐘就被徹底撕碎?

太平島禁區(qū)守了幾十年,為何12分鐘就被徹底撕碎?

潘撱旅行浪子
2026-06-16 19:43:58
男子打工忘了老家還養(yǎng)了600只毒蝎,5年后拆遷,他回家推開門瞬間愣住了……

男子打工忘了老家還養(yǎng)了600只毒蝎,5年后拆遷,他回家推開門瞬間愣住了……

品讀時刻
2026-06-11 09:04:59
柬埔寨電詐最大黑手竟然是副總理?

柬埔寨電詐最大黑手竟然是副總理?

鳳眼論
2026-06-18 18:45:10
“賀峻霖本科平均學分績點3.84”沖上熱搜,本人曬三好學生、獎學金等多張證書,已成功保研中國傳媒大學研究生

“賀峻霖本科平均學分績點3.84”沖上熱搜,本人曬三好學生、獎學金等多張證書,已成功保研中國傳媒大學研究生

閃電新聞
2026-06-15 16:35:37
香港男星住30億豪宅,母親為上市公司創(chuàng)辦人,不炒作豪門人設

香港男星住30億豪宅,母親為上市公司創(chuàng)辦人,不炒作豪門人設

悠悠說世界
2026-06-19 02:29:30
香港一男子在機場停車場遭伏擊,大腿及前臂被斬傷,6公斤黃金被搶,歹徒隨后駕車往東涌方向逃走,暫未有人被捕,警方正追緝涉案3名男子

香港一男子在機場停車場遭伏擊,大腿及前臂被斬傷,6公斤黃金被搶,歹徒隨后駕車往東涌方向逃走,暫未有人被捕,警方正追緝涉案3名男子

三湘都市報
2026-06-18 12:38:28
伊朗隊賽后突然被勒令離境!足聯主席親臨慰問,伊朗隊長道出無奈

伊朗隊賽后突然被勒令離境!足聯主席親臨慰問,伊朗隊長道出無奈

霽寒飄雪
2026-06-18 07:24:04
新加坡急了,外長幾乎是拍著桌子,讓中國“尊重”馬六甲的地位。

新加坡急了,外長幾乎是拍著桌子,讓中國“尊重”馬六甲的地位。

南權先生
2026-01-26 15:41:26
一年虧損四千萬,全國陷“關停潮”,曾經的金飯碗如今正慘遭拋棄

一年虧損四千萬,全國陷“關停潮”,曾經的金飯碗如今正慘遭拋棄

忠于法紀
2026-04-06 15:10:31
女大學生曬圖:馬甲線打卡成功,開心藏不住

女大學生曬圖:馬甲線打卡成功,開心藏不住

時光慢旅人
2026-06-18 00:42:04
2026-06-19 05:35:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12816文章數 176500關注度
往期回顧 全部

科技要聞

庫克承認扛不住了,蘋果漲價“不可避免”

頭條要聞

159瓶茅臺被扣3年后多瓶失蹤 警方:酒仍處于扣押時狀態(tài)

頭條要聞

159瓶茅臺被扣3年后多瓶失蹤 警方:酒仍處于扣押時狀態(tài)

體育要聞

英格蘭不再九子奪嫡,凱恩才是唯一真神

娛樂要聞

39歲梅西不愧是人生贏家!

財經要聞

博睿康IPO,賺錢業(yè)務與資本敘事是兩門生意

汽車要聞

驚出冷汗!重慶實測奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

家居
藝術
健康
數碼
公開課

家居要聞

綠意盎然 自然之境

藝術要聞

臺北東區(qū)新門戶!南港雙星,像一道“城市裂痕”

吃粽子的3條保胃法則,消化科醫(yī)生推薦

數碼要聞

銘瑄公布MCIO接口ITX主板方案,展示高密度接口優(yōu)勢

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版