免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

新版本發(fā)布,DeepSeek再掀效率革命|甲子光年

0
分享至



更便宜、更快,向Agent和國產(chǎn)替代更進一步。

作者|衛(wèi)琳聰 周悅

終于,DeepSeek-V4 來了。

距離上次版本發(fā)布已經(jīng)過去近5個月,期間多次有DeepSeek新版本發(fā)布的消息傳出,但都干打雷不下雨,等待的空氣里不免泛起一些懷疑。

4月24日,DeepSeek-V4 預(yù)覽版正式上線并同步開源,官方新聞稿里直接宣稱“邁入百萬上下文普惠時代”。

此次發(fā)布的版本包含兩款MoE語言模型——DeepSeek-V4-Pro和DeepSeek-V4-Flash。

前者總參數(shù)1.6T、激活參數(shù)49B,后者總參數(shù)284B、激活參數(shù)13B,兩者均支持一百萬token 上下文。

如果單看百萬上下文的能力,在V4之前市場上已有多款模型能夠?qū)崿F(xiàn),國外如谷歌Gemini ,國內(nèi)如阿里Qwen、月之暗面Kimi等。

DeepSeek-V4 令人驚艷的地方,是又一次帶來效率革命,在性能提升的同時實現(xiàn)成本下降,尤其是讓Agent更便宜成為可能。

更重要的是,V4為打破算力束縛提供了更大可能性,大模型的算力底座從英偉達向華為邁出了堅實一步。

1.轉(zhuǎn)向Agent

DeepSeek官方表示,V4在Agent能力、世界知識和推理性能上均實現(xiàn)國內(nèi)與開源領(lǐng)域的領(lǐng)先。

其中,DeepSeek-V4-Pro性能比肩頂級閉源模型。

在世界知識測評中,DeepSeek-V4-Pro大幅領(lǐng)先其他開源模型,僅稍遜于頂尖閉源模型Gemini-Pro-3.1。在推理性能上,DeepSeek-V4-Pro超越當(dāng)前所有已公開評測的開源模型,取得了世界頂級閉源模型相當(dāng)?shù)某煽儭?/p>

不過,技術(shù)報告顯示,最大推理強度模式DeepSeek-V4-Pro-Max性能仍略遜于GPT-5.4和Gemini 3.1-Pro,這表明其發(fā)展軌跡大致落后于最先進的前沿模型約3到6個月。


DeepSeek-V4-Pro-Max與同類模型的基準(zhǔn)性能對比

值得注意的是,DeepSeek-V4-Pro的Agent 能力大幅提高。

在對DeepSeek-V4技術(shù)報告的深入分析中,「甲子光年」注意到,V4在更明顯地轉(zhuǎn)向Agent任務(wù)。從V3.1到V3.2,DeepSeek已經(jīng)在強化工具調(diào)用和Agent能力,到了V4,這條線更清楚。

技術(shù)報告里出現(xiàn)了工具調(diào)用格式、推理內(nèi)容管理、Quick Instruction、Agent沙箱基礎(chǔ)設(shè)施,以及Search、White-Collar Task、Code Agent等真實任務(wù)評測。重點考察模型能不能在多步任務(wù)中低成本地調(diào)用工具、保留狀態(tài)、繼續(xù)執(zhí)行。

在Agent 能力提高的同時,V4提供的價格相當(dāng)實惠。緩存命中場景下,F(xiàn)lash版輸入成本低至0.2元/百萬Token。對于需要大量、多輪次Token交互的Agent應(yīng)用來說,這無疑是降低成本的好消息。

能力提高、價格下降,毫無疑問,V4在瞄準(zhǔn)Agent 發(fā)力,也將進一步推動Agent 的普及。

2.更便宜、更快

DeepSeek-V4系列此次表現(xiàn)出的最大特點,是在長上下文場景中極高的效率。

在1M上下文設(shè)置下,V4-Pro的單token推理FLOPs只有V3.2的27%,所需KV緩存空間也僅為其10%。

而參數(shù)激活數(shù)量更少的DeepSeek-V4-Flash則進一步提升了效率:在百萬上下文中,其單token推理FLOPs僅為DeepSeek-V3.2的10%,KV緩存容量僅為7%。


DeepSeek-V4系列與DeepSeek-V3.2的推理FLOPs計算量及KV緩存容量

基于這種進步,DeepSeek官方宣布,“從現(xiàn)在開始,1M(一百萬)上下文將是 DeepSeek 所有官方服務(wù)的標(biāo)配?!?/strong>

這帶來了什么?最直觀的就是價格便宜。

處理一個Token所需的總計算量驟降,直接導(dǎo)致在云端處理每一條請求的電力、硬件磨損和運營成本都斷崖式下降。這是DeepSeek敢于將API定價打到行業(yè)地板價。

DeepSeek V4-Flash輸出價為2元/百萬token,不到同天發(fā)布的GPT-5.5 Pro輸出價(180美元)的千分之二。


除了更便宜,模型也會更快。KV緩存占用降低,也有助于提升并發(fā)能力,并在一定程度上改善長上下文請求的響應(yīng)效率。

讓或許能讓許多曾經(jīng)“奢侈”的應(yīng)用場景成為現(xiàn)實。例如,將整個代碼庫塞進上下文進行跨文件的“智能體編程”(Agentic Coding)、讓AI進行長時間的自主規(guī)劃與反思等。

效率的提高源自工程層面的創(chuàng)新。

「甲子光年」認(rèn)為,在延續(xù)底層工程哲學(xué)的基礎(chǔ)上,V4的重點進一步轉(zhuǎn)向兩個問題:一是如何低成本支持百萬token上下文,二是如何讓更復(fù)雜的模型結(jié)構(gòu)和后訓(xùn)練流程穩(wěn)定運行。

最核心的結(jié)構(gòu)創(chuàng)新是混合注意力機制(HybridAttention),這讓V4的長上下文效率大幅提升。

大模型在生成內(nèi)容時,需要不斷回看此前上下文。上下文越長,需要保存和調(diào)用的KV緩存就越多,每生成一個新Token時的推理開銷也會隨之增加。DeepSeek-V4的思路是,將長上下文分層處理,將壓縮稀疏注意力(CSA)與重度壓縮注意力(HCA)相結(jié)合。

具體來說,V4將壓縮稀疏注意力(CSA)和重度壓縮注意力(HCA)結(jié)合:CSA先壓縮KV信息,再篩選與當(dāng)前query最相關(guān)的部分參與計算;HCA則以更高壓縮率保留遠距離上下文的粗粒度信息。同時,滑動窗口注意力(SWA)處理近處上下文細(xì)節(jié),彌補壓縮機制可能導(dǎo)致的局部信息損失。

通俗地說,傳統(tǒng)注意力機制更像把整本書逐頁攤開,每次答題都重新翻一遍;V4則更像更像是一個智能索引,把近處內(nèi)容保留原文,把遠處內(nèi)容壓縮成章節(jié)摘要。

另一項核心架構(gòu)創(chuàng)新是流形約束超連接(mHC),用于增強底層穩(wěn)定性。混合注意力機制解決的是模型“怎么看長文本”,mHC解決的是模型內(nèi)部信息“如何穩(wěn)定傳遞”。

技術(shù)報告中提到,通過重計算、融合算子等工程優(yōu)化,mHC帶來的額外訓(xùn)練時間開銷被控制在約6.7%。這表明它并非單純的理論構(gòu)想,而是適配V4大規(guī)模生產(chǎn)訓(xùn)練的實用設(shè)計。

DeepSeek對V4的架構(gòu)很有信心,表示其性能可與GPT-5.2和Gemini-3.0-Pro相媲美,確立了其作為處理復(fù)雜推理任務(wù)的高性價比架構(gòu)的地位。


DeepSeek-V4系列的整體架構(gòu)

3.加速國產(chǎn)替代

另一個值得注意的地方是,此次DeepSeek-V4與華為的關(guān)聯(lián)更強。

技術(shù)報告中提到一個細(xì)節(jié):DeepSeek的細(xì)粒度專家并行優(yōu)化方案已經(jīng)在英偉達GPU和華為昇騰NPU上驗證。

并且,這套方案在通用推理負(fù)載中帶來1.50—1.73倍加速,在強化學(xué)習(xí)采樣和高速智能體服務(wù)等低延遲場景中最高達到1.96倍加速。

這并不等于V4全棧已經(jīng)完全適配昇騰,但意味著昇騰950超節(jié)點對V4-Pro的意義不只是增加算力,也在于提升多卡協(xié)同能力。若后續(xù)供給和適配順利,V4-Pro的吞吐和成本空間有望改善。

DeepSeek在V4發(fā)布的官宣文章中,用一行小字寫道:預(yù)計下半年昇騰950超節(jié)點批量上市后,pro的價格會大幅下調(diào)。

另一方面,技術(shù)報告還提到,DeepSeek-V4系列的路由專家參數(shù)均采用FP4精度。雖然在現(xiàn)有硬件上,F(xiàn)P4×FP8運算的峰值FLOPs性能與FP8 × FP8運算相同,但從理論上講,在未來硬件上其效率可提高三分之一,這將進一步提升DeepSeek-V4系列的運算效率。

據(jù)「甲子光年」觀察,從V3開始,DeepSeek就沒有單純依賴參數(shù)規(guī)模,而是持續(xù)優(yōu)化訓(xùn)練效率、顯存占用和硬件利用率。在訓(xùn)練工程上,V4引入Muon優(yōu)化器,并進一步使用FP4/FP8低精度訓(xùn)練。前者用于提升收斂速度和訓(xùn)練穩(wěn)定性,后者用于降低顯存、帶寬和推理成本。

這可謂DeepSeek-V4 在技術(shù)選型上的一個“伏筆”:它在當(dāng)前硬件上選擇了成熟的 FP8×FP8 路線,但架構(gòu)設(shè)計已為未來的 FP4×FP8 混合精度運算做好了準(zhǔn)備,一旦硬件成熟,效率將立刻躍升。

這意味著 V4 未來有望在單卡上運行更大模型,推理成本也有望繼續(xù)下降。

同時,基于DeepSeek的高效架構(gòu),即使國產(chǎn)AI芯片單卡算力絕對值不如英偉達等頂級產(chǎn)品,也能憑借其高吞吐、低顯存占用的優(yōu)勢運行大模型。

這無疑進一步打破了算力束縛,國產(chǎn)替代的步伐加快了。

(封面圖由AI生成,文中配圖來自:DeepSeek)



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
暗黑心理學(xué):一個男人可以花錢去嫖一個長期賣淫的女人,卻始終不肯原諒出軌悔罪回家的老婆。這是怎么回事呢?

暗黑心理學(xué):一個男人可以花錢去嫖一個長期賣淫的女人,卻始終不肯原諒出軌悔罪回家的老婆。這是怎么回事呢?

心理觀察局
2026-06-17 06:38:26
沉默45年,中國第二輪"嚴(yán)打"終于來了!目標(biāo)改變總體戰(zhàn)正式打響

沉默45年,中國第二輪"嚴(yán)打"終于來了!目標(biāo)改變總體戰(zhàn)正式打響

職場資深秘書
2026-06-15 16:41:48
感謝你們開除我!被裁第3天,他就打出巔峰,身價翻24倍

感謝你們開除我!被裁第3天,他就打出巔峰,身價翻24倍

體壇熱評
2026-06-18 17:55:26
抹黑董路的原因,是因為很多訓(xùn)練營教練,收不到家長的禮了?

抹黑董路的原因,是因為很多訓(xùn)練營教練,收不到家長的禮了?

酷侃體壇
2026-06-18 22:58:33
郭碧婷沒想到,向家遺產(chǎn)交給自己僅3月,向佐因一番話,口碑暴漲

郭碧婷沒想到,向家遺產(chǎn)交給自己僅3月,向佐因一番話,口碑暴漲

君笙的拂兮
2026-06-19 05:48:52
“同學(xué)媽媽把我兒子害成學(xué)渣”,家長使壞能有多離譜,長見識了

“同學(xué)媽媽把我兒子害成學(xué)渣”,家長使壞能有多離譜,長見識了

澤澤先生
2026-06-18 19:40:25
明日端午節(jié),提醒中老人:1不吃、2不去、3要洗、4要穿

明日端午節(jié),提醒中老人:1不吃、2不去、3要洗、4要穿

時尚的弄潮
2026-06-18 10:54:10
4:1!1:1!悲喜夜,瑞士4分晉級無憂,捷克痛失好局,韓國迎良機

4:1!1:1!悲喜夜,瑞士4分晉級無憂,捷克痛失好局,韓國迎良機

呀古銅
2026-06-19 05:05:05
昔日國安“水貨”踢世界杯,離隊10年逆襲,球隊最體面的散伙外援

昔日國安“水貨”踢世界杯,離隊10年逆襲,球隊最體面的散伙外援

體壇鑒春秋
2026-06-18 15:13:28
25倍暴利+驗光造假:誰在收割中國家長的“近視焦慮”?

25倍暴利+驗光造假:誰在收割中國家長的“近視焦慮”?

電腦報少年派
2026-06-16 17:28:51
父母1萬5退休金養(yǎng)外孫13年,女兒給婆婆買100萬房子后,母親清醒

父母1萬5退休金養(yǎng)外孫13年,女兒給婆婆買100萬房子后,母親清醒

黑貓故事所
2025-04-27 13:16:24
CBA消息!李楠無緣執(zhí)教北京,上海續(xù)約古德溫 楊百翰積極接觸徐昕

CBA消息!李楠無緣執(zhí)教北京,上海續(xù)約古德溫 楊百翰積極接觸徐昕

中國籃壇快訊
2026-06-18 18:03:12
把G7當(dāng)反華大會的高市,被李在明狠狠上了一課!丑態(tài)盡顯國人怒罵

把G7當(dāng)反華大會的高市,被李在明狠狠上了一課!丑態(tài)盡顯國人怒罵

一口娛樂
2026-06-19 03:25:06
溫州商人助佛得角門將家人辦理簽證赴美,當(dāng)事人:在佛得角生活23年,資助過不少足球隊,相信佛得角隊會繼續(xù)創(chuàng)造奇跡

溫州商人助佛得角門將家人辦理簽證赴美,當(dāng)事人:在佛得角生活23年,資助過不少足球隊,相信佛得角隊會繼續(xù)創(chuàng)造奇跡

大風(fēng)新聞
2026-06-18 22:41:03
向佐采訪透露向佑成婚,談及弟媳習(xí)慣,心疼弟弟患病希望減少討論

向佐采訪透露向佑成婚,談及弟媳習(xí)慣,心疼弟弟患病希望減少討論

人間煙火記事本
2026-06-17 22:38:45
C羅梅西世界杯首秀跑動曝光!誰更拼?

C羅梅西世界杯首秀跑動曝光!誰更拼?

時光慢旅人
2026-06-19 00:19:20
最可恥的遺產(chǎn)。。。

最可恥的遺產(chǎn)。。。

西樓飲月
2026-06-16 23:27:27
丈夫出軌閨蜜,我平靜離婚,他帶閨蜜回家時,婆婆的一句話他懵了

丈夫出軌閨蜜,我平靜離婚,他帶閨蜜回家時,婆婆的一句話他懵了

千秋文化
2026-06-06 19:50:00
北京首家!三甲醫(yī)院幫你護理老人,還能用醫(yī)保!

北京首家!三甲醫(yī)院幫你護理老人,還能用醫(yī)保!

BRTV新聞
2026-06-18 15:13:54
粗俗不堪!廣東一寶媽在班級群接連辱罵老師與自己丈夫,引發(fā)熱議

粗俗不堪!廣東一寶媽在班級群接連辱罵老師與自己丈夫,引發(fā)熱議

火山詩話
2026-06-18 08:27:39
2026-06-19 06:39:00
甲子光年
甲子光年
中國科技產(chǎn)業(yè)化前沿智庫
3485文章數(shù) 9274關(guān)注度
往期回顧 全部

科技要聞

庫克承認(rèn)扛不住了,蘋果漲價“不可避免”

頭條要聞

瑞士4-1波黑獲小組賽首勝 曼贊比替補登場進兩球

頭條要聞

瑞士4-1波黑獲小組賽首勝 曼贊比替補登場進兩球

體育要聞

英格蘭不再九子奪嫡,凱恩才是唯一真神

娛樂要聞

39歲梅西不愧是人生贏家!

財經(jīng)要聞

博??礗PO,賺錢業(yè)務(wù)與資本敘事是兩門生意

汽車要聞

驚出冷汗!重慶實測奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

親子
游戲
本地
藝術(shù)
軍事航空

親子要聞

央媒曝光,涉多個知名品牌,檢測結(jié)果觸目驚心,網(wǎng)友怒了:沒人性

PS5版《GTA6》已有店家開始預(yù)定!售價545元

本地新聞

世界杯黑馬佛得角:河北人開超市,溫州人當(dāng)老板

藝術(shù)要聞

臺北東區(qū)新門戶!南港雙星,像一道“城市裂痕”

軍事要聞

伊朗外交部:美伊已簽署諒解備忘錄

無障礙瀏覽 進入關(guān)懷版