免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

告別科研“七步馬拉松”,一個(gè)AI智能體正在改寫知識(shí)生產(chǎn)方式

0
分享至



如果把科研流程整體交給智能體執(zhí)行,會(huì)發(fā)生什么?

科研這件事,長(zhǎng)期被浪漫化了。

它并不是一個(gè)統(tǒng)一的動(dòng)作,而是一條被拆分得很細(xì)的流水線。檢索、篩選、閱讀、整理、假設(shè)、實(shí)驗(yàn)、驗(yàn)證,再回到寫作與發(fā)表——這七個(gè)環(huán)節(jié)幾乎構(gòu)成了所有學(xué)術(shù)工作的基本路徑。

問題在于,這條路徑的每一個(gè)環(huán)節(jié),都在消耗時(shí)間,但并不都在創(chuàng)造價(jià)值。

文獻(xiàn)檢索往往意味著在成千上萬篇論文中篩選出幾十篇真正相關(guān)的內(nèi)容。閱讀階段需要逐篇理解方法與結(jié)論,再在腦中建立一個(gè)尚不穩(wěn)定的認(rèn)知結(jié)構(gòu)。真正到問題定義時(shí),研究者才開始進(jìn)入“創(chuàng)造”的部分,而這往往已經(jīng)消耗掉了大量時(shí)間。

這些環(huán)節(jié),本質(zhì)上都屬于“確定性勞動(dòng)”,它們可以被拆解、被描述、被重復(fù)執(zhí)行,但依然依賴人工完成。這就形成了一種典型的錯(cuò)配:最寶貴的認(rèn)知資源,被大量消耗在最容易被替代的部分。

過去十年,AI確實(shí)進(jìn)入了科研,但更多停留在邊緣。它幫人更快地找論文、更順暢地翻譯文本、甚至能寫出一篇結(jié)構(gòu)完整的綜述,但這些能力并沒有改變科研的基本形態(tài)。科研仍然是一場(chǎng)“七步馬拉松”,只是跑得稍微快了一點(diǎn)。

一個(gè)更激進(jìn)的命題擺到了臺(tái)面上:如果把科研流程整體交給智能體執(zhí)行,會(huì)發(fā)生什么?

近期剛剛升級(jí)的AI學(xué)術(shù)智能體切問學(xué)術(shù)(即WisPaper中文版)給出了一種新可能。把確定性的勞動(dòng)交給算力,把不確定的靈感還給人。這句話的背后,是一整套關(guān)于科研生產(chǎn)方式的重新分配。



AI不生產(chǎn)論文,但加速進(jìn)程

傳統(tǒng)科研過程中,七步走的科研馬拉松,需要人在不同環(huán)節(jié)之間反復(fù)切換與銜接。

切問學(xué)術(shù)的出現(xiàn),并不意味著它可以直接生產(chǎn)論文。它更多是嵌入到科研的推進(jìn)過程中,成為一種貫穿式能力。給定一個(gè)研究任務(wù),系統(tǒng)可以從文獻(xiàn)檢索出發(fā),完成閱讀、分析與信息結(jié)構(gòu)化,在此基礎(chǔ)上識(shí)別潛在問題,進(jìn)一步進(jìn)入實(shí)驗(yàn)設(shè)計(jì)與執(zhí)行,最終輸出結(jié)果與報(bào)告。

AI在科研中的角色,也因此發(fā)生變化。過去的AI更像“助手”,它在旁邊提供建議,或者幫你完成某一部分工作。這些工作多是局部性的,比如翻譯一篇論文,總結(jié)一段內(nèi)容,或者補(bǔ)全一段代碼,研究者需要不斷接管流程,在不同任務(wù)之間來回切換,維持整體推進(jìn)。

無法避免的機(jī)器幻覺,又讓這部分工作需要被復(fù)審,以此來規(guī)避可能出現(xiàn)的學(xué)術(shù)欺詐、造假風(fēng)險(xiǎn)。切問學(xué)術(shù)作為AI智能體的定位,更接近“執(zhí)行者”,它可以在沒有持續(xù)人工介入的情況下,自主完成一部分內(nèi)容。這意味著,科研流程第一次出現(xiàn)“被托管”的可能。

用一個(gè)更直觀的類比,它有點(diǎn)像自動(dòng)駕駛。在自動(dòng)駕駛體系中,人類負(fù)責(zé)設(shè)定目標(biāo),系統(tǒng)負(fù)責(zé)路徑與執(zhí)行。

同樣的邏輯正在引入科研之后,類似的分工正在出現(xiàn)。研究者定義問題,切問學(xué)術(shù)作為智能體負(fù)責(zé)推進(jìn)過程。

科研流程的變化,從這里開始顯現(xiàn)。

首先是流程的歸屬被重新劃分。原本需要人逐步完成的任務(wù),被整合為一段可以被系統(tǒng)整體接管的過程。檢索、閱讀、整理這些原本高度依賴人工的環(huán)節(jié),不再需要逐一介入,而是在同一套邏輯中被連續(xù)處理。



其次,科研的工作方式從串行過程轉(zhuǎn)向并行結(jié)構(gòu)。在此類AI智能體介入后,科研不再只能沿著單一路徑推進(jìn)。多個(gè)假設(shè)可以被同時(shí)展開,多個(gè)方向可以并行驗(yàn)證。一個(gè)研究者的工作方式,從完成一個(gè)問題,轉(zhuǎn)向管理一組問題。

當(dāng)流程本身開始被重新組織,科研的節(jié)奏也隨之改變。

100倍速引擎,科研第一次出現(xiàn)“代差”

從產(chǎn)品能力上來說,切問學(xué)術(shù)做的第一件事,是把傳統(tǒng)科研路徑的鏈條“解耦”。在傳統(tǒng)路徑里,每一個(gè)環(huán)節(jié)之間都存在等待與切換成本。而切問學(xué)術(shù)帶來的,是指數(shù)級(jí)別的效率提升。

這種變化是具體的。據(jù)其公開資料顯示,對(duì)比傳統(tǒng)人工,切問學(xué)術(shù)的AI4S模式,在文獻(xiàn)檢索方面預(yù)估提效10至100倍,原本需要數(shù)周完成的文獻(xiàn)篩選,被壓縮到分鐘級(jí);論文閱讀20倍提升,需要數(shù)月完成的閱讀與整理,被壓縮到小時(shí)級(jí)的結(jié)構(gòu)化提取;問題識(shí)別可以在全域數(shù)據(jù)中被系統(tǒng)性掃描與定位,50倍速鎖定。這樣的效率飛升,幾乎可以說重塑科研生命周期。

與此同時(shí),切問學(xué)術(shù)的提效,建立在有效且可靠的基礎(chǔ)上。就其公布數(shù)據(jù)來看,切問學(xué)術(shù)的文獻(xiàn)搜索準(zhǔn)確率達(dá)到93.78%,而主流模型大致停留在70%左右;文檔版式解析、公式解析與表格解析準(zhǔn)確率均在90%以上,整體高于行業(yè)水平。



這些能力并不直接產(chǎn)生結(jié)論,卻決定了信息以什么形態(tài)進(jìn)入后續(xù)處理。變量關(guān)系、實(shí)驗(yàn)結(jié)構(gòu)、數(shù)據(jù)分布被提前拆解,閱讀從逐篇處理轉(zhuǎn)為結(jié)構(gòu)化接收。

尤其是切問學(xué)術(shù)在測(cè)試中的綜述一致性達(dá)到了22.26%,并且引用真實(shí)性接近99.8%。前者決定了不同來源的信息是否能夠被納入同一套邏輯框架,后者則真正在杜絕生成式模型機(jī)器幻覺方面邁出了一大步。

也正是在這樣的基礎(chǔ)之上,其嵌入科研流程的價(jià)值,才有成立的空間。

本次升級(jí)中的一大亮點(diǎn),在于實(shí)驗(yàn)等環(huán)節(jié)的深入。上傳一篇論文,系統(tǒng)自動(dòng)完成閱讀與理解,拆解核心任務(wù)與算法邏輯;在此基礎(chǔ)上,解析實(shí)驗(yàn)方法,生成可執(zhí)行的實(shí)驗(yàn)方案;隨后自動(dòng)搭建計(jì)算環(huán)境,包括算力配置與依賴項(xiàng);生成代碼并執(zhí)行實(shí)驗(yàn)流程,最終輸出結(jié)果與完整實(shí)驗(yàn)報(bào)告。

整個(gè)過程,不需要人工逐步介入。切問學(xué)術(shù)可以基于已有文獻(xiàn)或系統(tǒng)識(shí)別出的研究空白,自動(dòng)生成實(shí)驗(yàn)路徑,并且自主匹配或?qū)ふ覕?shù)據(jù),完成環(huán)境搭建,執(zhí)行實(shí)驗(yàn)并輸出結(jié)果。

傳統(tǒng)科研流程中的“認(rèn)知”與“執(zhí)行”是分離的。理解可以被加速,但驗(yàn)證仍然依賴人。而現(xiàn)在原本需要人反復(fù)切換、反復(fù)試錯(cuò)的一整段,被整體提速。科研流程,從“人驅(qū)動(dòng)”變成“智能驅(qū)動(dòng)”。

在這個(gè)意義上,它或許代表著科研效率的代際更替。

而這一切,并不是通用大模型就可以實(shí)現(xiàn)的。比如說學(xué)習(xí)能力,傳統(tǒng)大模型或許擅長(zhǎng)考試,但是對(duì)于從未見過的新知識(shí),存在學(xué)習(xí)障礙。在CL-bench測(cè)試中,大模型們需要理解一套完全陌生的規(guī)則,并在上下文中立即應(yīng)用。大多數(shù)模型在這一環(huán)節(jié)失效,平均成功率只有17.2%。



科研場(chǎng)景恰恰依賴這種能力,每一個(gè)問題,都是新的。當(dāng)模型可以在上下文中快速建立規(guī)則理解,它才具備進(jìn)入科研流程的基礎(chǔ)。

也正因此,切問學(xué)術(shù)針對(duì)如何在真實(shí)環(huán)境中推進(jìn)任務(wù)有針對(duì)性優(yōu)化。其進(jìn)行的AgentGym-RL的訓(xùn)練方式,是更接近真實(shí)科研的環(huán)境,模型需要在網(wǎng)頁操作、實(shí)驗(yàn)流程等任務(wù)中不斷調(diào)整路徑。執(zhí)行不能依賴預(yù)設(shè)答案,而是在反饋中不斷修正。

就相關(guān)論文文獻(xiàn)顯示,一個(gè)僅有70億參數(shù)的小模型(Llama-3.1-8B),經(jīng)過AgentGym-RL訓(xùn)練后,在多個(gè)場(chǎng)景中達(dá)到了與GPT-4o、Claude 3.5-Sonnet相當(dāng)甚至更好的表現(xiàn)。

同時(shí),在訓(xùn)練過程中其針對(duì)推理、代碼等關(guān)鍵能力相關(guān)的Token賦予更高權(quán)重,讓能力提升與訓(xùn)練指標(biāo)對(duì)齊。

但即便具備在真實(shí)環(huán)境中推進(jìn)任務(wù)的能力,這件事依然沒有那么簡(jiǎn)單。模型要真正進(jìn)入科研流程,還要解決一個(gè)更隱蔽的問題,訓(xùn)練本身的穩(wěn)定性。

RLHF幾乎是所有大模型對(duì)齊能力的核心路徑。但這套方法有一個(gè)共識(shí)性的難點(diǎn):PPO訓(xùn)練極不穩(wěn)定。這也是為什么,很多模型在短任務(wù)中表現(xiàn)良好,一旦進(jìn)入復(fù)雜流程,就開始出現(xiàn)不可控偏移。

切問學(xué)術(shù)通過PPO-max通過更細(xì)粒度的約束與獎(jiǎng)勵(lì)機(jī)制,讓訓(xùn)練過程保持穩(wěn)定,不再依賴運(yùn)氣。

穩(wěn)定之后,是執(zhí)行。調(diào)用工具、編寫代碼、處理環(huán)境依賴,這些環(huán)節(jié)本身就充滿不確定性。傳統(tǒng)模型在這一部分往往依賴模板,或者停留在“生成代碼”的層面,一旦進(jìn)入真實(shí)執(zhí)行環(huán)境,就會(huì)出現(xiàn)偏差。

科研環(huán)境里,信息本身并不總是一致的。不同論文之間可能存在結(jié)論沖突,數(shù)據(jù)來源也可能帶來偏差。模型如果只是簡(jiǎn)單整合,很容易在多源信息中失真。

而切問學(xué)術(shù)在面對(duì)“已有記憶”與“當(dāng)前輸入”不一致時(shí),會(huì)在內(nèi)部形成兩條處理路徑,最終根據(jù)不同信號(hào)強(qiáng)度做出選擇。這讓模型在復(fù)雜文獻(xiàn)環(huán)境中具備基本的判斷能力,而不是被動(dòng)接受信息。

當(dāng)這些能力聚合,變化就不再是局部的提升。它更代表著,科研的生產(chǎn)方式,正在發(fā)生一次真正的范式轉(zhuǎn)變。

當(dāng)科研回歸到“人”,加速突破的臨界點(diǎn)

在這場(chǎng)變化里,被改變的并不只是效率。

科研的工作方式,開始從親自完成每一步,轉(zhuǎn)向在關(guān)鍵節(jié)點(diǎn)做判斷。當(dāng)執(zhí)行被系統(tǒng)接管,研究者不再需要反復(fù)進(jìn)入那些確定性的流程,而是逐漸退出具體操作,轉(zhuǎn)而站在更上層的位置去理解問題、選擇路徑、審視結(jié)果。

這種變化看起來微妙,也在悄悄重寫科研的角色分工。那些最聰明的大腦,不再需要在流程中奔跑。從更接近執(zhí)行者的角色,轉(zhuǎn)向架構(gòu)者或者說領(lǐng)導(dǎo)者。

同時(shí),另一道隱形門檻也在消失。在很多領(lǐng)域,idea和結(jié)果之間隔著代碼、算力與實(shí)驗(yàn)環(huán)境。這部分需求一旦被切問學(xué)術(shù)一類的智能體解決,科研的進(jìn)入門檻會(huì)被重新定義。

結(jié)果是,科研競(jìng)爭(zhēng)開始前移。從誰能做出來,變成誰能更早看到問題,回歸到了定義問題的“人”。一些原本受限于技術(shù)條件的研究者,也可以更直接參與到問題本身。



科研的本質(zhì),是知識(shí)生產(chǎn)。當(dāng)知識(shí)生產(chǎn)的周期被壓縮,影響的是整個(gè)技術(shù)體系的節(jié)奏。除了時(shí)間成本下降之外,知識(shí)庫更新頻率也在同步加速。比如新材料、靶向藥、清潔能源這些受到驗(yàn)證成本限制的領(lǐng)域,驗(yàn)證一旦被壓縮,路徑篩選會(huì)明顯加快,錯(cuò)誤方向更早被淘汰,可行路徑更快浮現(xiàn)。

這意味著,研究會(huì)在更高密度的試探中不斷逼近答案。原本需要多年才能積累的試錯(cuò)過程,被壓縮到更短周期內(nèi)反復(fù)發(fā)生。

技術(shù)突破的出現(xiàn)方式,也隨之發(fā)生變化,從依賴個(gè)體經(jīng)驗(yàn)的偶然發(fā)現(xiàn),轉(zhuǎn)向在高頻驗(yàn)證中逐步收斂。

當(dāng)這種節(jié)奏持續(xù)疊加,一個(gè)更接近臨界點(diǎn)的狀態(tài)開始出現(xiàn)??蒲虚_始進(jìn)入一種新的分工結(jié)構(gòu):AI負(fù)責(zé)推進(jìn)已知路徑,把確定性的部分持續(xù)壓縮;而人則停留在未知區(qū)域,去判斷哪些問題值得被繼續(xù)追問。

封面來源|視覺中國(guó)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
智駕不識(shí)別無預(yù)警無自動(dòng)剎車,大廠出品新能源車遭遇集體維權(quán)!

智駕不識(shí)別無預(yù)警無自動(dòng)剎車,大廠出品新能源車遭遇集體維權(quán)!

車知事
2026-06-17 18:05:05
不打伊朗了,美軍突然調(diào)轉(zhuǎn)槍口,集結(jié)航母和遼寧艦正面對(duì)峙!

不打伊朗了,美軍突然調(diào)轉(zhuǎn)槍口,集結(jié)航母和遼寧艦正面對(duì)峙!

騷年先鋒
2026-06-18 23:17:24
法拉利F1奧地利站將迎重磅升級(jí)

法拉利F1奧地利站將迎重磅升級(jí)

體壇周報(bào)
2026-06-19 21:30:12
蔣介石前妻赴京拜見周總理,初見就為女婿辯解,懷疑其是共產(chǎn)黨人

蔣介石前妻赴京拜見周總理,初見就為女婿辯解,懷疑其是共產(chǎn)黨人

磊子講史
2026-06-11 19:34:18
中東,突傳大消息!美伊?xí)勅∠∫晾首钚掳l(fā)聲!以色列稱不會(huì)撤軍!黃金、白銀暴跌!

中東,突傳大消息!美伊?xí)勅∠?!伊朗最新發(fā)聲!以色列稱不會(huì)撤軍!黃金、白銀暴跌!

證券時(shí)報(bào)
2026-06-19 13:02:12
娜然霍啟山傳婚訊不足24小時(shí),女方全曝光,霍家金字招牌遇考驗(yàn)

娜然霍啟山傳婚訊不足24小時(shí),女方全曝光,霍家金字招牌遇考驗(yàn)

悅君兮君不知
2026-06-19 17:40:13
熬夜看完英格蘭4-2,我才明白:那1.25億后腰真不是炒出來的

熬夜看完英格蘭4-2,我才明白:那1.25億后腰真不是炒出來的

觀星娛記
2026-06-19 09:39:52
鐮田大地:次輪就算只拿到1分,只要末輪取勝總分也能達(dá)到5分

鐮田大地:次輪就算只拿到1分,只要末輪取勝總分也能達(dá)到5分

懂球帝
2026-06-19 07:33:07
外交部長(zhǎng)“喬冠華”后人今何在??jī)鹤幼映懈笜I(yè),女兒名氣家喻戶曉

外交部長(zhǎng)“喬冠華”后人今何在??jī)鹤幼映懈笜I(yè),女兒名氣家喻戶曉

文史達(dá)觀
2026-06-17 20:24:25
剛剛?cè)毡拘迹喝刖澈炞C的費(fèi)用直接上漲5倍

剛剛?cè)毡拘迹喝刖澈炞C的費(fèi)用直接上漲5倍

看看新聞Knews
2026-06-20 00:05:56
為啥有些人不敢爬泰山?網(wǎng)友:當(dāng)?shù)厝巳チ烁静桓襾y說話

為啥有些人不敢爬泰山?網(wǎng)友:當(dāng)?shù)厝巳チ烁静桓襾y說話

阿康四歲啦
2026-06-18 12:17:55
2026年養(yǎng)老金政策落地,實(shí)現(xiàn)22連漲,這3類人群養(yǎng)老金漲幅有變化

2026年養(yǎng)老金政策落地,實(shí)現(xiàn)22連漲,這3類人群養(yǎng)老金漲幅有變化

職場(chǎng)資深秘書
2026-06-18 15:24:42
世界杯一戰(zhàn)成名!23 歲無名小將打懵英格蘭,直接被曼聯(lián)盯上!

世界杯一戰(zhàn)成名!23 歲無名小將打懵英格蘭,直接被曼聯(lián)盯上!

瀾歸序
2026-06-19 06:17:45
輸球不可怕,輸人最丟人!這支球隊(duì)輸球又輸人,丟光亞洲足球臉面

輸球不可怕,輸人最丟人!這支球隊(duì)輸球又輸人,丟光亞洲足球臉面

低調(diào)看天下
2026-06-19 12:22:53
太意外了!2032奧運(yùn)舉辦地敲定:結(jié)果驚呆眾人,奧運(yùn)格局大變!

太意外了!2032奧運(yùn)舉辦地敲定:結(jié)果驚呆眾人,奧運(yùn)格局大變!

小濤叨叨
2026-04-22 17:06:20
都罵董潔看走眼,但沒人知道,王大治除了外貌低配,其他全是頂配

都罵董潔看走眼,但沒人知道,王大治除了外貌低配,其他全是頂配

山谷里的怒吼
2026-06-12 13:22:54
女子談釋永信過往,她們姐妹住少林寺3天2夜,爭(zhēng)著往釋永信房間跑

女子談釋永信過往,她們姐妹住少林寺3天2夜,爭(zhēng)著往釋永信房間跑

江山揮筆
2025-07-29 16:50:59
石明新疆場(chǎng)直播,登帶貨總榜榜首,這個(gè)第一分析起來可以這么說

石明新疆場(chǎng)直播,登帶貨總榜榜首,這個(gè)第一分析起來可以這么說

一窺究竟
2026-06-19 14:31:48
誰能抵擋住張馨予的盛世美顏,李晨真是錯(cuò)過了

誰能抵擋住張馨予的盛世美顏,李晨真是錯(cuò)過了

娛你同歡
2026-06-18 23:07:07
極速達(dá),害了山姆

極速達(dá),害了山姆

中國(guó)新聞周刊
2026-06-19 13:14:39
2026-06-20 05:31:00
36氪 incentive-icons
36氪
讓一部分人先看到未來
151693文章數(shù) 2848863關(guān)注度
往期回顧 全部

科技要聞

Anthropic被禁,智譜卻漲瘋了

頭條要聞

特朗普:伊朗走投無路徹底完蛋了 我們就把這60天耗完

頭條要聞

特朗普:伊朗走投無路徹底完蛋了 我們就把這60天耗完

體育要聞

世界杯最不知名球員,沒上場(chǎng)先漲粉600萬

娛樂要聞

孫藝珍曬母子合照!4歲小甜豆暴風(fēng)成長(zhǎng)

財(cái)經(jīng)要聞

Token低價(jià)陷阱

汽車要聞

驚出冷汗!重慶實(shí)測(cè)奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

藝術(shù)
親子
家居
公開課
軍事航空

藝術(shù)要聞

放大100倍都不怕!這位“人肉打印機(jī)”畫家,把絲綢畫出了呼吸感

親子要聞

從毒奶粉到毒紙尿褲,兒童用品安全防線為何屢屢失守

家居要聞

綠意盎然 自然之境

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

霸氣!端午節(jié)最硬核的“龍舟”競(jìng)渡來了

無障礙瀏覽 進(jìn)入關(guān)懷版