免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

實(shí)測(cè) GLM-5.2 :Claude 5 關(guān)停后,它真能穩(wěn)穩(wěn)接住這波用戶

0
分享至

前幾天 Fable 5 對(duì)海外用戶關(guān)停的時(shí)候,智譜突然宣布向 GLM Coding Plan 全量用戶開(kāi)放了 GLM-5.2,并表示「前沿智能不應(yīng)只屬于少數(shù)人,也不應(yīng)被少數(shù)規(guī)則隨手收回?!?/p>

APPSO 也第一時(shí)間體驗(yàn)了 GLM-5.2 ,用了幾天后,我似乎能理解為什么網(wǎng)絡(luò)上對(duì) GLM-5.2 的好評(píng)會(huì)那么多,這可能真是一個(gè)被低估的模型,至少在編程方面。

▲ 資本市場(chǎng)對(duì) GLM-5.2 的反應(yīng)

今天,GLM-5.2 正式發(fā)布,多個(gè) Benchmark 刷新了記錄,甚至領(lǐng)先 GPT-5.5。當(dāng)處理復(fù)雜的系統(tǒng)優(yōu)化和大型研究任務(wù)時(shí),它與頂級(jí)商業(yè)模型 Claude Opus 4.8 的差距,也正在被拉平到 1% 以內(nèi)。

在技術(shù)博客里,智譜提到 GLM-5.2 最核心的突破,是在 1M 的上下文長(zhǎng)度下,依然能處理極度復(fù)雜、充滿噪聲的代碼調(diào)試和系統(tǒng)架構(gòu)任務(wù)。

看 benchmark 不夠直觀,我們找了一些可視化比較強(qiáng)的任務(wù),直觀的對(duì)比 GLM-5.2、GPT-5.5 和 Opus 4.8 做同一套題的表現(xiàn)。

編程介于 Claude 4.7 和 4.8 之間

類似于「復(fù)制 XX 項(xiàng)目」的提示詞對(duì)現(xiàn)階段的大語(yǔ)言模型來(lái)說(shuō),大概它的訓(xùn)練數(shù)據(jù)里,就已經(jīng)包括了完整的 XX 項(xiàng)目代碼。像是之前的復(fù)制一個(gè) macOS / Windows / Linux 系統(tǒng),還有復(fù)制不同的游戲,越來(lái)越像是在考察模型的記憶力,而不是編程能力。

但真正能做到的表現(xiàn)好、Bug 少、符合我們期待的交付還是少之又少。我們就用一個(gè)簡(jiǎn)單的提示詞「制作一個(gè) Minecraft 克隆游戲」。

這款經(jīng)典游戲,GLM-5.2 能復(fù)刻里面的多少元素呢。

啟動(dòng)界面簡(jiǎn)單說(shuō)明了鍵盤和鼠標(biāo)的操作信息,點(diǎn)擊開(kāi)始之后,這個(gè)游戲的場(chǎng)景和交互,幾乎是做到了「我的世界」真克隆版。

讓我非常意外的是我可以飛行,并且整個(gè)體驗(yàn)就像是在玩世界模型一樣,不受視角和空間的限制,可以一直飛行到無(wú)限遠(yuǎn)的地方。

我們也用其他的模型進(jìn)行測(cè)試,分別是使用 GPT-5.5 的 Codex 和 Opus 4.8 的 Claude Code,其中三款模型的思考深度都被設(shè)置為最高等級(jí)。

GPT-5.5 沒(méi)有直接叫它 Minecraft,而是改了個(gè)名字叫 Voxelcraft。啟動(dòng)界面看著更真實(shí),但是實(shí)際的操作對(duì)比 GLM-5.2 少了跳躍、視角等選項(xiàng)。

雖然 GPT-5.5 加了一個(gè)晝夜更替的功能,但是一到晚上和黃昏,整個(gè)頁(yè)面是非常不視覺(jué)友好的,很多畫面都是一片漆黑,而且時(shí)間的切換比較生硬。

Opus 4.8 和 GLM 5.2 的表現(xiàn)幾乎是一樣的,我甚至懷疑是不是 Claude Code 的配置出現(xiàn)了問(wèn)題,我沒(méi)有把 GLM 的 API 配置正確,導(dǎo)致使用的還是 Opus 4.8 模型。

檢查 Token 消耗之后,確實(shí)是 GLM-5.2 在處理相關(guān)的任務(wù)。

我能理解,為什么網(wǎng)上都流傳著 Fable 5 要關(guān)閉,是因?yàn)?GLM-5.2 太強(qiáng)。

在這個(gè)游戲復(fù)刻的編程任務(wù)上,GLM-5.2 的表現(xiàn)很明顯要好過(guò) GPT-5.5,和 Opus 4.8 是一個(gè)梯隊(duì)。

繼續(xù)測(cè)試,這次我們不給模板,直接一個(gè)概念,「用 Three.js 構(gòu)建一個(gè)游戲的演示版本,一艘可完全探索的星艦,配備可操作的駕駛艙、船員艙、從真實(shí)舷窗外漂過(guò)的行星、動(dòng)態(tài)光照、睡眠/進(jìn)食互動(dòng)等功能。 」

雖然看著有點(diǎn)簡(jiǎn)陋了,但是基本實(shí)現(xiàn)了我們的要求,而且看著窗外還有其他行星,還是動(dòng)了一點(diǎn)腦子。

但要論簡(jiǎn)陋,還是比不上 GPT-5.5,簡(jiǎn)陋到根本就不知道這個(gè)駕駛艙、船員艙到底在哪里。而且,GPT-5.5 生成的網(wǎng)頁(yè),也是 GLM-5.2 和 Opus 4.8 三個(gè)之中,唯一一個(gè)沒(méi)有添加背景音樂(lè)的模型。

和「我的世界」一樣,GPT-5.5 生成的代碼場(chǎng)景總是有一種不真實(shí)感,可以稱之為是 Vibe Coding 網(wǎng)頁(yè)里的 AI 味。

Opus 4.8 的表現(xiàn)再次和 GLM-5.2 類似,雖然大部分的元素還是很簡(jiǎn)單樸素,但是基本的功能實(shí)現(xiàn)了。

三個(gè)模型在完成這個(gè)任務(wù)時(shí),所消耗的時(shí)間,不算上我自己點(diǎn)擊「允許」等待的時(shí)間,基本上都在 1h 以上。

使用 Three.js 是每個(gè)模型必備的能力,但是要能用它做出一個(gè)好看的 3D 網(wǎng)站,沒(méi)有「我的世界」類似的指引,單憑一句提示詞,模型要領(lǐng)會(huì)意圖并且不偷懶,還是很難。

這兩個(gè)測(cè)試在 X 上都有 Fable 5 相關(guān)的案例,能看到 GLM-5.2 在一些編程任務(wù)的交付成果,確實(shí)和 Fable 5 有得一拼。但星艦的表現(xiàn),三個(gè)模型里,GLM-5.2 和 Opus 4.8 應(yīng)該是一檔,F(xiàn)able 5 又是獨(dú)一檔,而 GPT-5.5 的表現(xiàn)就有些不盡如人意了。

如果說(shuō)「我的世界」對(duì)這些編程能力極強(qiáng)的模型來(lái)說(shuō)還是太簡(jiǎn)單了,那么直接讓它來(lái)做一個(gè)「黑神話.悟空」,表現(xiàn)又會(huì)如何。

同樣的,我們?cè)谑褂?GLM-5.2 的 Claude Code 終端、使用 Opus 4.8 的 Claude Code App,以及使用 GPT-5.5 的 Codex App 里輸入提示詞進(jìn)行測(cè)試,「1:1 克隆一個(gè)網(wǎng)頁(yè)可以玩的黑神話.悟空?!?/p>

GLM-5.2 給的效果除了這個(gè)啟動(dòng)頁(yè)的色彩搭配符合黑神話的元素,但是開(kāi)始游戲之后,就是一個(gè)很普通的場(chǎng)景,一個(gè)小人在一條固定的路線上,隨機(jī)有怪物刷新出來(lái),就僅此而已。

不過(guò)該有的招式和動(dòng)作,GLM 5.2 都做到了,并且在結(jié)束生成時(shí),GLM 5.2 提到,這不是一個(gè) 1:1 克隆,只是一個(gè)致敬向的瀏覽器動(dòng)作游戲,復(fù)刻的《黑神話:悟空》的核心手感。

如果想要更接近原作的 3D 視角版本,還需要再告訴它,用 Three.js 重做一版。所以大概現(xiàn)在的 AI 都會(huì)「偷懶」,一邊想著早點(diǎn)交付給焦急等待的我們,另一邊我們期待的又是完整準(zhǔn)確的結(jié)果。

關(guān)于「偷懶」這件事,智譜在模型技術(shù)博客里面也提到,在強(qiáng)化學(xué)習(xí)(RL)訓(xùn)練中,編碼 Agent 往往極其容易出現(xiàn)「獎(jiǎng)勵(lì)作弊」。

模型發(fā)現(xiàn),只要學(xué)會(huì)抄近道,直接用一行 curl 命令把 GitHub 上的標(biāo)準(zhǔn)答案拉下來(lái),或者把系統(tǒng)里藏著的測(cè)試用例文件復(fù)制過(guò)來(lái),原樣喂給自己的解題腳本,就能在評(píng)價(jià)系統(tǒng)中拿到滿分。

這種「捷徑」雖然讓基準(zhǔn)測(cè)試得分極其好看,卻徹底廢掉了模型自主思考的能力。

GLM-5.2 這次專門引入了嚴(yán)苛的「反黑客」模塊,使用規(guī)則過(guò)濾來(lái)攔截明顯的惡意指令;以及 AI 法官,用來(lái)深度分析 Agent 的調(diào)用意圖。

一旦發(fā)現(xiàn)模型不是在「寫代碼」,而是在「套答案」,系統(tǒng)會(huì)立即返回偽造的干擾信息。更有意思的是,模型不會(huì)因此直接停止任務(wù),而是會(huì)通過(guò)這種模擬訓(xùn)練,強(qiáng)迫自己回歸到正確的編碼路徑上。

這種「對(duì)抗式訓(xùn)練」帶來(lái)的直接結(jié)果,就是 GLM-5.2 在 SWE-Marathon 等超長(zhǎng)跨度基準(zhǔn)測(cè)試中,綜合表現(xiàn)來(lái)到了第一梯隊(duì)。

GPT-5.5 的表現(xiàn)也很難評(píng),似乎他們獲取黑神話的信息都是通過(guò)文字信息,因此不能理解這種大世界的風(fēng)格。GLM-5.2 是至少有一個(gè)月亮在背景,GPT-5.5 就完全變成了一個(gè)純 2D 的單一背景游戲。

Opus 4.8 是直接做成了一個(gè)移動(dòng)端的游戲,整體體驗(yàn)又是和 GLM 5.2 最像的一個(gè)。同樣是單一的線條上,孫悟空拿著金箍棒去攻擊隨機(jī)刷新的妖怪。

Opus 4.8 在生成的時(shí)候提到還原了游戲里的招牌機(jī)制,像是每段積累「棍勢(shì)」,攢滿用 K 放破防重劈的金箍棒連招,以及閃避、定身術(shù)等動(dòng)作。

當(dāng)我們要求 GLM 5.2 做出 3D 視角版本時(shí),Claude Code 的總結(jié)頁(yè)面提到整體的場(chǎng)景、角色、相機(jī)控制、戰(zhàn)斗、敵人,以及 HUB 都有了新的樣式。

我們預(yù)覽新的頁(yè)面,發(fā)現(xiàn)啟動(dòng)頁(yè)還是一樣,但是這個(gè) 3D 版還是相當(dāng)簡(jiǎn)陋,雖然是有六根立柱,但都不是我們想象中的場(chǎng)景。大概要求 Three.js 做一個(gè)大世界,叫人類程序員來(lái)也不一定能做到。

開(kāi)源追上閉源的周期在縮短

GPT-5.5 是在 4 月 23 日發(fā)布,GLM-5.2 在六月,兩個(gè)月不到的時(shí)間,GLM-5.2 的表現(xiàn)在一些具體的編程任務(wù)上已經(jīng)要好過(guò) GPT-5.5。

百萬(wàn) token 上下文、小時(shí)級(jí)任務(wù)、可調(diào)思考成本、agentic RL、推理服務(wù)優(yōu)化,這些開(kāi)源模型現(xiàn)在都能做到。

但顯而易見(jiàn)的是,等到即將發(fā)布的 GPT-5.6,無(wú)論是從跑分還是具體的表現(xiàn),可能又會(huì)比現(xiàn)在 GLM-5.2 要好。

最后,無(wú)論開(kāi)源還是閉源,一筆 Coding Plan 的費(fèi)用都會(huì)是現(xiàn)在 Vibe Coding 玩家的常態(tài)。國(guó)外大模型的標(biāo)準(zhǔn)是 20 美元/月,國(guó)產(chǎn)大模型是 20 人民幣/月左右。

此次 GLM-5.2 發(fā)布,智譜也提到了 Coding Plan 里的計(jì)費(fèi)安排,GLM-5.2 在高峰時(shí)段消耗 3 倍額度,離峰時(shí)段 2 倍額度,9 月底前離峰使用按 1 倍額度促銷。

▲ 在 Claude Code 內(nèi)選擇 low、medium、high 都對(duì)應(yīng) GLM-5.2 的 high,而 xhigh、max、ultracode 對(duì)應(yīng)的是 max。

此外,在 Claude Code 里啟用 1M 上下文要使用 GLM-5.2[1m] 這個(gè)模型名,還能選擇 High 或 Max。ZCode 桌面代理也接入了 GLM-5.2,帶 /goal 長(zhǎng)任務(wù)、SSH 遠(yuǎn)程開(kāi)發(fā)、移動(dòng)端控制等功能,6 月 30 日前還有 1.5 倍有效額度活動(dòng)。

▲ 類似于 Codex 類應(yīng)用的 Zcode

長(zhǎng)任務(wù)能力再?gòu)?qiáng),最終還是會(huì)落到「我們?cè)敢庠谀男┤蝿?wù)上花這筆額度」。

對(duì)比出爾反爾,隨意修改 Claude Agent SDK(已撤回),又是封號(hào)又是人臉驗(yàn)證,天天狼來(lái)了的某 A 社,GLM-5.2 在編程上,對(duì)國(guó)內(nèi)用戶來(lái)說(shuō)或許會(huì)是一個(gè)值得嘗試的選擇。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
為什么洪秀全長(zhǎng)達(dá)十一年,沒(méi)有離開(kāi)“天王府”?

為什么洪秀全長(zhǎng)達(dá)十一年,沒(méi)有離開(kāi)“天王府”?

南書房
2026-06-19 13:00:12
紐約記者“封殺”貝基·哈蒙:禁止入城365天

紐約記者“封殺”貝基·哈蒙:禁止入城365天

元?dú)鉂M分吖
2026-06-20 00:19:07
當(dāng)年明月悟得那么通透,為什么依然過(guò)不好一生?

當(dāng)年明月悟得那么通透,為什么依然過(guò)不好一生?

新浪財(cái)經(jīng)
2026-06-14 00:52:12
iPhone 18售價(jià)或暴漲270美元,共享單車漲價(jià)

iPhone 18售價(jià)或暴漲270美元,共享單車漲價(jià)

自愈小日子
2026-06-20 00:09:01
誤報(bào)梅西父親去世!阿根廷女主播直播“翻車”,道歉后辭職

誤報(bào)梅西父親去世!阿根廷女主播直播“翻車”,道歉后辭職

紅星新聞
2026-06-19 09:06:34
又反轉(zhuǎn)了!以色列同意停火,美股期貨拉升,國(guó)際油價(jià)直線跳水!黃金白銀短線反彈

又反轉(zhuǎn)了!以色列同意停火,美股期貨拉升,國(guó)際油價(jià)直線跳水!黃金白銀短線反彈

新浪財(cái)經(jīng)
2026-06-19 21:37:45
暗黑心理學(xué):一個(gè)男人可以花錢去嫖一個(gè)長(zhǎng)期賣淫的女人,卻始終不肯原諒出軌悔罪回家的老婆。這是怎么回事呢?

暗黑心理學(xué):一個(gè)男人可以花錢去嫖一個(gè)長(zhǎng)期賣淫的女人,卻始終不肯原諒出軌悔罪回家的老婆。這是怎么回事呢?

心理觀察局
2026-06-17 06:38:26
中國(guó)男籃12人名單基本定了!楊瀚森隊(duì)內(nèi)放話帶傷沖,9人將被淘汰

中國(guó)男籃12人名單基本定了!楊瀚森隊(duì)內(nèi)放話帶傷沖,9人將被淘汰

愛(ài)體育的小悠悠
2026-06-19 14:18:56
連夜驅(qū)逐!世界杯沖突升級(jí),多國(guó)人員被波及,國(guó)際足聯(lián)討好沒(méi)用

連夜驅(qū)逐!世界杯沖突升級(jí),多國(guó)人員被波及,國(guó)際足聯(lián)討好沒(méi)用

就像當(dāng)初啊
2026-06-18 21:28:46
世界杯炸鍋!英格蘭王牌被質(zhì)疑,名宿開(kāi)噴:只會(huì)虐菜,硬仗純隱身

世界杯炸鍋!英格蘭王牌被質(zhì)疑,名宿開(kāi)噴:只會(huì)虐菜,硬仗純隱身

奶蓋熊本熊
2026-06-19 04:21:24
廣西29歲美女“奇跡木木”去世!前1天熬夜做陪玩,收費(fèi)20遭跑單

廣西29歲美女“奇跡木木”去世!前1天熬夜做陪玩,收費(fèi)20遭跑單

她時(shí)尚丫
2026-06-19 20:36:41
C羅梅西世界杯首秀跑動(dòng)曝光!誰(shuí)更拼?

C羅梅西世界杯首秀跑動(dòng)曝光!誰(shuí)更拼?

時(shí)光慢旅人
2026-06-19 00:19:20
悲劇!24歲加拿大中場(chǎng)腿骨斷裂:休戰(zhàn)5個(gè)月 俱樂(lè)部最高獲賠750萬(wàn)歐

悲劇!24歲加拿大中場(chǎng)腿骨斷裂:休戰(zhàn)5個(gè)月 俱樂(lè)部最高獲賠750萬(wàn)歐

風(fēng)過(guò)鄉(xiāng)
2026-06-19 10:56:34
門將下飯送大禮,韓國(guó)輸球“早有預(yù)謀”!小組第二去洛杉磯半主場(chǎng)

門將下飯送大禮,韓國(guó)輸球“早有預(yù)謀”!小組第二去洛杉磯半主場(chǎng)

中國(guó)足球的那些事兒
2026-06-19 11:48:00
30年一遇!武漢遭遇極端強(qiáng)降雨,武昌火車站及周邊淪為重災(zāi)區(qū)

30年一遇!武漢遭遇極端強(qiáng)降雨,武昌火車站及周邊淪為重災(zāi)區(qū)

火山詩(shī)話
2026-06-19 10:47:47
你是真不怕單身漢!農(nóng)村女老師背心單穿,被提醒后高呼穿衣自由!

你是真不怕單身漢!農(nóng)村女老師背心單穿,被提醒后高呼穿衣自由!

世界圈
2026-06-17 09:50:03
央視直播:莊宇珊洗刷3分恥辱,塞止連敗,日本六連勝?

央視直播:莊宇珊洗刷3分恥辱,塞止連敗,日本六連勝?

陳錈愛(ài)體育
2026-06-19 10:57:38
一場(chǎng)毒紙尿褲引發(fā)的鬧劇,誰(shuí)在說(shuō)謊?誰(shuí)來(lái)給千萬(wàn)寶媽一個(gè)交代?

一場(chǎng)毒紙尿褲引發(fā)的鬧劇,誰(shuí)在說(shuō)謊?誰(shuí)來(lái)給千萬(wàn)寶媽一個(gè)交代?

迷世書童
2026-06-20 00:05:15
狀元不是迪班薩?奇才認(rèn)真考慮選擇彼得森 布澤爾威爾遜退出競(jìng)爭(zhēng)

狀元不是迪班薩?奇才認(rèn)真考慮選擇彼得森 布澤爾威爾遜退出競(jìng)爭(zhēng)

羅說(shuō)NBA
2026-06-19 13:29:22
成本3億,預(yù)計(jì)虧損2.5億,端午檔最慘電影誕生了

成本3億,預(yù)計(jì)虧損2.5億,端午檔最慘電影誕生了

影視高原說(shuō)
2026-06-19 11:20:36
2026-06-20 00:44:49
愛(ài)范兒 incentive-icons
愛(ài)范兒
消費(fèi)科技第一媒體
38991文章數(shù) 2601941關(guān)注度
往期回顧 全部

科技要聞

Anthropic被禁,智譜卻漲瘋了

頭條要聞

特朗普:伊朗走投無(wú)路徹底完蛋了 我們就把這60天耗完

頭條要聞

特朗普:伊朗走投無(wú)路徹底完蛋了 我們就把這60天耗完

體育要聞

世界杯最不知名球員,沒(méi)上場(chǎng)先漲粉600萬(wàn)

娛樂(lè)要聞

孫藝珍曬母子合照!4歲小甜豆暴風(fēng)成長(zhǎng)

財(cái)經(jīng)要聞

Token低價(jià)陷阱

汽車要聞

驚出冷汗!重慶實(shí)測(cè)奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

教育
時(shí)尚
數(shù)碼
藝術(shù)
軍事航空

教育要聞

高考送考就是全社會(huì)對(duì)孩子最大的溺愛(ài)!

夏天上衣穿短不穿長(zhǎng),看看下面這幾款短上衣,顯高舒適顯比例

數(shù)碼要聞

SSD太貴換回HDD:機(jī)械硬盤價(jià)格連漲5個(gè)季度!

藝術(shù)要聞

放大100倍都不怕!這位“人肉打印機(jī)”畫家,把絲綢畫出了呼吸感

軍事要聞

霸氣!端午節(jié)最硬核的“龍舟”競(jìng)渡來(lái)了

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版