免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

蘋果渴求的端側(cè)AI殺出黑馬:首個(gè)認(rèn)知模型誕生,4B打平GPT-5.4!

0
分享至


新智元報(bào)道


【新智元導(dǎo)讀】在剛過去的 WWDC 上,蘋果 Siri 借 AI 重生成為關(guān)鍵詞,「端側(cè)模型」已成趨勢!更早些時(shí)候,Andrej Karpathy 呼吁把模型的知識(shí)剝離、只保留「認(rèn)知核心」。一家中國公司稱已將這一方向落地——4B 參數(shù),在群體智能任務(wù)中打出千億級(jí)大模型的效果。端側(cè)認(rèn)知模型到底能改變什么?

昨晚,Siri 借谷歌的 1.2 萬億參數(shù) Gemini 重生了。

但另一頭,亞馬遜卻關(guān)停了引發(fā)巨大爭議的內(nèi)部 AI 排行榜——員工大量使用 AI 工具,算力開銷飆升到管理層坐不住的地步。

Token 成本成為 AI 大規(guī)模落地最硬的一道門檻。

Andrej Karpathy 之前在訪談中給出了一個(gè)方向:把模型里的海量知識(shí)剝離掉,只保留一個(gè)會(huì)思考、會(huì)規(guī)劃、知道自己不知道什么的「認(rèn)知核心」,1B 級(jí)別的參數(shù)就夠。


https://www.youtube.com/watch?v=lXUZvyajciY

這個(gè)方向正在被驗(yàn)證。

一個(gè) 4B 參數(shù)的模型,在群體智能任務(wù)中打出了與 GPT-5.4 等千億級(jí)大模型等效的結(jié)果,且支持端側(cè)部署。

它來自一家創(chuàng)始團(tuán)隊(duì),曾以 3.6B 參數(shù)擊敗 65B Llama、登頂日本 Hugging Face 排行榜。

這次,他們做出了行業(yè)首個(gè)端側(cè)認(rèn)知模型

Karpathy 的預(yù)言與算力的賬單

算力成本的壓力已經(jīng)從技術(shù)議題變成財(cái)務(wù)議題,亞馬遜的案例只是縮影。

亞馬遜員工通過內(nèi)部 AI 工具頻繁調(diào)用大模型推理能力,推高了整體算力支出,管理層不得不緊急叫停排行榜機(jī)制以遏制用量。


https://www.ft.com/content/b1a62a7f-6df5-4c90-94ce-64ce9c9961b6?syn-25a6b1a6=1

行業(yè)正在經(jīng)歷第一次「Token 大撤退」,部分公司的單日算力消耗已觸及億元量級(jí)。

大模型的商業(yè)模型正撞上一堵結(jié)構(gòu)性的墻:能力越強(qiáng)、推理鏈越深,單次調(diào)用的成本越高。

GPU 成本營收比(GPU Cost / Revenue)是所有 AI 公司的命門指標(biāo),模型參數(shù)持續(xù)膨脹的趨勢只會(huì)讓這個(gè)指標(biāo)更難看。

Karpathy 的思路指向了另一條路:他提出需要把模型中的「記憶 / 知識(shí)」剝離掉,保留他所說的「認(rèn)知核心」——

一個(gè)被剝離了海量事實(shí)、知識(shí),但保留了思考算法、智能魔力、問題解決策略的實(shí)體。

他判斷,即便是 10 億參數(shù)的規(guī)模,也能實(shí)現(xiàn)高效的類人思考:

它會(huì)像人類一樣思考……如果你問它一個(gè)事實(shí)性問題,它可能需要查閱——它知道自己不知道,并且會(huì)去查。

這段話在技術(shù)社區(qū)引發(fā)廣泛討論。

方向上的共識(shí)正在形成,但能將「認(rèn)知核心」從概念推到可部署產(chǎn)品的團(tuán)隊(duì),才是真正的變量。


4B 打平千億級(jí)

新程 Alpha 做了什么

把 Karpathy 描述的「認(rèn)知核心」從概念推到產(chǎn)品的,是明日新程(Nextie)。

這家公司對(duì)開源推理模型進(jìn)行強(qiáng)化學(xué)習(xí)訓(xùn)練,將知識(shí)與認(rèn)知解耦——?jiǎng)冸x模型中記憶性的知識(shí)儲(chǔ)備,強(qiáng)化泛化和抽象思考能力。

產(chǎn)出的模型被命名為新程 Alpha,參數(shù)規(guī)模 4B,已完成訓(xùn)練并部署上線,是行業(yè)中首個(gè)被定義為「認(rèn)知模型」的產(chǎn)品。

具體到其訓(xùn)練方法,其實(shí)是一個(gè)不常見的起點(diǎn)。

明日新程團(tuán)隊(duì)整理了 1800 年至 2020 年、跨越 220 年的人類學(xué)術(shù)論文,試圖梳理出群體智能的演化脈絡(luò),為技術(shù)路線提供參照系。

在這套研究的基礎(chǔ)上對(duì)開源推理模型做強(qiáng)化學(xué)習(xí),專注于提升泛化和抽象能力。

舉一個(gè)直觀的例子:經(jīng)過訓(xùn)練的模型能將圍棋選手的決策模式遷移到日常生活場景——Karpathy 所說的「保留思考算法」,在這里有了具體的技術(shù)實(shí)現(xiàn)。

效果層面,新程 Alpha 在群體智能任務(wù)(辯論、反思、挑戰(zhàn)、投票等環(huán)節(jié))中,4B 參數(shù)達(dá)到了與 GPT-5.4 等大模型等效的輸出質(zhì)量,算力消耗和推理速度優(yōu)勢顯著。

更值得關(guān)注的是這個(gè)模型解鎖的場景空間,有三層遞進(jìn)的意義。

第一層,多智能體決策質(zhì)量提升。

在 Harness 決策框架中,使用認(rèn)知模型的輸出效果優(yōu)于推理模型。

底層模型從「推理」升級(jí)為「認(rèn)知」,帶來的是多智能體協(xié)作系統(tǒng)中決策鏈條整體質(zhì)量的躍升。

第二層,算力成本量級(jí)縮減。

4B 相較于千億參數(shù)模型,云端部署的算力開銷大幅降低。

新程 Alpha 同時(shí)支持端側(cè)部署——MacBook、具身智能設(shè)備均可直接運(yùn)行,算力成本由此轉(zhuǎn)化為電力成本。

這對(duì)具身智能領(lǐng)域意義尤為突出:用千億參數(shù)大模型驅(qū)動(dòng)一個(gè)家務(wù)機(jī)器人,每一次「思考」都在消耗大量 Token,綜合成本可能比請(qǐng)人做家務(wù)還貴。

4B 端側(cè)部署,從根本上改寫了這筆賬。

第三層,主動(dòng)式(Proactive)場景解鎖。

當(dāng)前絕大多數(shù) AI 產(chǎn)品運(yùn)行在響應(yīng)式(Reactive)模式下——用戶發(fā)指令,模型響應(yīng)。

Proactive 模式意味著智能體自主決策和執(zhí)行任務(wù),無需等待命令,商業(yè)規(guī)模遠(yuǎn)超 Reactive,但過去始終被算力成本擋在門外。

新程 Alpha 支持 24 小時(shí)不間斷運(yùn)行,成本可控,讓此前因?yàn)樘F而擱置的主動(dòng)式智能體成為可能。


團(tuán)隊(duì)底牌與賽道卡位

明日新程由微軟小冰創(chuàng)始團(tuán)隊(duì)創(chuàng)立。

這個(gè)團(tuán)隊(duì)的標(biāo)簽是「用小參數(shù)贏大參數(shù)」——此前訓(xùn)練的開源模型 rinna(日本小冰)以 3.6B 參數(shù)登頂日本 Hugging Face 排行榜第一名,擊敗了 65B 參數(shù)的 Llama。

新程 Alpha 用 4B 打平千億級(jí)大模型的效果,延續(xù)的是同一套技術(shù)基因。


明日新程重倉布局的賽道是——Harness 群體多智能體。

這條賽道正在獲得頭部資本的確認(rèn)——2026 年 3 月,OpenAI 投資了初創(chuàng)公司 Isara,直接將其估值推至 6.5 億美元,Isara 的研究方向正是多智能體協(xié)同與群體智能。


https://www.wsj.com/tech/ai/openai-backs-new-ai-startup-seeking-bot-army-breakthroughs-a0b1fedc

在該領(lǐng)域的智能深度評(píng)測(IDI)中,明日新程的綜合表現(xiàn)顯著高于任何單一大模型。


資本驗(yàn)證了賽道價(jià)值,評(píng)測數(shù)據(jù)則標(biāo)定了明日新程在賽道內(nèi)的位置。

兩個(gè)信號(hào)疊加,指向同一個(gè)判斷:群體多智能體是 AI 應(yīng)用層的下一個(gè)高價(jià)值方向,認(rèn)知模型是驅(qū)動(dòng)它的關(guān)鍵基礎(chǔ)設(shè)施。

認(rèn)知模型改變的

不只是參數(shù),更是賬本

GPU 成本營收比(GPU Cost / Revenue)是懸在所有 AI 公司頭上的達(dá)摩克利斯之劍。

認(rèn)知模型提供的解法,核心指向經(jīng)濟(jì)模型的重構(gòu)——用 4B 達(dá)到千億級(jí)才能達(dá)到的效果,意味著同樣的輸出質(zhì)量對(duì)應(yīng)一套完全不同的成本結(jié)構(gòu)。

明日新程在采訪中透露,團(tuán)隊(duì)正在訓(xùn)練泛化能力更強(qiáng)的 8B 認(rèn)知模型。

如果 4B 已經(jīng)能在群體智能任務(wù)中對(duì)標(biāo) GPT-5.4,8B 的能力邊界值得期待。

一個(gè)更深遠(yuǎn)的問題留給整個(gè)行業(yè):當(dāng)端側(cè)全天候運(yùn)行一個(gè)認(rèn)知模型的成本降至可忽略的水平,今天所有基于「用戶發(fā)指令、模型響應(yīng)」的響應(yīng)式(Reactive)模式設(shè)計(jì)的 AI 產(chǎn)品,可能都需要重新審視自己的產(chǎn)品形態(tài)。

主動(dòng)式(Proactive)智能體的商業(yè)想象空間,遠(yuǎn)超當(dāng)前響應(yīng)式(Reactive)智能體下的一切。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
格拉維納:我拒絕了曼奇尼的回歸,加圖索本不應(yīng)該辭職

格拉維納:我拒絕了曼奇尼的回歸,加圖索本不應(yīng)該辭職

懂球帝
2026-06-18 20:44:25
18日金價(jià)炸鍋!黃金一夜跳水,國內(nèi)金店最新價(jià)格全在這》

18日金價(jià)炸鍋!黃金一夜跳水,國內(nèi)金店最新價(jià)格全在這》

王二哥老搞笑
2026-06-19 00:18:58
薩哈:為了葡萄牙在本屆世界杯走得更遠(yuǎn),C羅有時(shí)必須接受替補(bǔ)

薩哈:為了葡萄牙在本屆世界杯走得更遠(yuǎn),C羅有時(shí)必須接受替補(bǔ)

懂球帝
2026-06-19 01:20:28
亨利炮轟C羅遭回?fù)?!埃弗拉怒噴:歷史射手王還需要你來教進(jìn)球?

亨利炮轟C羅遭回?fù)?!埃弗拉怒噴:歷史射手王還需要你來教進(jìn)球?

體育閑話說
2026-06-18 22:24:36
酒商稱159瓶茅臺(tái)被扣后缺失 警方通報(bào)來了!

酒商稱159瓶茅臺(tái)被扣后缺失 警方通報(bào)來了!

看看新聞Knews
2026-06-19 01:16:02
重磅免簽!皇馬 36 小時(shí)閃電敲定巨星!穆里尼奧親自出手,伯納烏迎來全能中場新核

重磅免簽!皇馬 36 小時(shí)閃電敲定巨星!穆里尼奧親自出手,伯納烏迎來全能中場新核

硯底沉香
2026-06-18 12:22:36
4-2大勝!1-0絕殺!克羅地亞慘敗后再遭重創(chuàng),小組出線難了

4-2大勝!1-0絕殺!克羅地亞慘敗后再遭重創(chuàng),小組出線難了

歷史膠囊
2026-06-18 10:04:54
《聯(lián)合早報(bào)》發(fā)文怒批中國網(wǎng)民:肆意無端攻擊弱小鄰國,令人寒心

《聯(lián)合早報(bào)》發(fā)文怒批中國網(wǎng)民:肆意無端攻擊弱小鄰國,令人寒心

小徐講八卦
2026-06-18 10:58:58
和訊尚偉:節(jié)后迎接變盤!A股節(jié)后準(zhǔn)備醞釀突

和訊尚偉:節(jié)后迎接變盤!A股節(jié)后準(zhǔn)備醞釀突

和訊網(wǎng)
2026-06-18 17:22:41
80歲知名書畫家與小38歲女伴,曬150平米豪宅房產(chǎn)證,引熱議

80歲知名書畫家與小38歲女伴,曬150平米豪宅房產(chǎn)證,引熱議

火山詩話
2026-06-18 07:04:01
一人中招,全家陽性?我國超一半人感染這種超強(qiáng)致癌細(xì)菌

一人中招,全家陽性?我國超一半人感染這種超強(qiáng)致癌細(xì)菌

健康觸點(diǎn)
2026-06-16 06:05:37
葡萄牙隊(duì)賽后B費(fèi)社媒賽后被沖:你是不是害怕傳球給C羅?

葡萄牙隊(duì)賽后B費(fèi)社媒賽后被沖:你是不是害怕傳球給C羅?

懂球帝
2026-06-18 16:30:47
打死也不能放冰箱10種食物,回家立刻拿出來,別拿家人健康開玩笑

打死也不能放冰箱10種食物,回家立刻拿出來,別拿家人健康開玩笑

小柱解說游戲
2026-06-16 07:38:45
華為新品突然上架,6月18日,已正式開售

華為新品突然上架,6月18日,已正式開售

科技堡壘
2026-06-18 09:53:46
穆里尼奧皇馬清洗名單出爐!皇馬球星主動(dòng)申請(qǐng)解約,遭到球隊(duì)拒絕

穆里尼奧皇馬清洗名單出爐!皇馬球星主動(dòng)申請(qǐng)解約,遭到球隊(duì)拒絕

夜白侃球
2026-06-18 11:34:05
馬尼拉只能放低姿態(tài),主動(dòng)找中國求助

馬尼拉只能放低姿態(tài),主動(dòng)找中國求助

回京歷史夢
2026-06-18 16:20:51
G7發(fā)表聲明,不許武力改變臺(tái)?,F(xiàn)狀?中方回應(yīng)用詞相當(dāng)罕見

G7發(fā)表聲明,不許武力改變臺(tái)?,F(xiàn)狀?中方回應(yīng)用詞相當(dāng)罕見

娛樂圈的筆娛君
2026-06-19 00:41:30
少林寺新方丈釋印樂,上任才10個(gè)月,少林寺被曝一下少了800多萬

少林寺新方丈釋印樂,上任才10個(gè)月,少林寺被曝一下少了800多萬

許三歲
2026-06-14 09:57:24
粗俗不堪!廣東一寶媽在班級(jí)群接連辱罵老師與自己丈夫,引發(fā)熱議

粗俗不堪!廣東一寶媽在班級(jí)群接連辱罵老師與自己丈夫,引發(fā)熱議

火山詩話
2026-06-18 08:27:39
徹底沒了!八家知名汽車品牌被永久凍結(jié)車輛生產(chǎn)資質(zhì)

徹底沒了!八家知名汽車品牌被永久凍結(jié)車輛生產(chǎn)資質(zhì)

XCiOS俱樂部
2026-06-17 20:43:42
2026-06-19 05:04:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
15499文章數(shù) 66925關(guān)注度
往期回顧 全部

科技要聞

庫克承認(rèn)扛不住了,蘋果漲價(jià)“不可避免”

頭條要聞

159瓶茅臺(tái)被扣3年后多瓶失蹤 警方:酒仍處于扣押時(shí)狀態(tài)

頭條要聞

159瓶茅臺(tái)被扣3年后多瓶失蹤 警方:酒仍處于扣押時(shí)狀態(tài)

體育要聞

英格蘭不再九子奪嫡,凱恩才是唯一真神

娛樂要聞

39歲梅西不愧是人生贏家!

財(cái)經(jīng)要聞

博睿康IPO,賺錢業(yè)務(wù)與資本敘事是兩門生意

汽車要聞

驚出冷汗!重慶實(shí)測奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

時(shí)尚
數(shù)碼
教育
房產(chǎn)
健康

看不懂球,還看不懂帥哥嗎?

數(shù)碼要聞

銘瑄公布MCIO接口ITX主板方案,展示高密度接口優(yōu)勢

教育要聞

畢業(yè)即高薪!高考生緊盯這6個(gè)專業(yè),畢業(yè)后50%能到國企就業(yè)!

房產(chǎn)要聞

商業(yè)清零式退潮,大量住宅登場!三亞又要大規(guī)模調(diào)規(guī)!

吃粽子的3條保胃法則,消化科醫(yī)生推薦

無障礙瀏覽 進(jìn)入關(guān)懷版