免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI看病成為醫(yī)患新包袱?補(bǔ)上「多輪追問」,通用AI才邁得過醫(yī)療關(guān)

0
分享至

衡宇 Jay 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

應(yīng)該不只是我家里的長輩天天抱著AI“看病”吧?

這年頭,大家是越來越習(xí)慣把癥狀、化驗(yàn)單、病歷丟給AI了。

正所謂春江水暖鴨先知,身處一線的醫(yī)生們就對這個(gè)事情深有體會(huì)。越來越多患者帶著AI生成的“自我判斷結(jié)果”去醫(yī)院問診,有些醫(yī)生甚至反饋,門診里不少人帶著同一套AI結(jié)論來求證。

患者過度依賴大模型診斷,導(dǎo)致醫(yī)患溝通成本增加。界面新聞采訪的三甲醫(yī)院醫(yī)生就非常無奈:

“上午看了30個(gè)號,25個(gè)病人是帶著AI結(jié)論來的?!?/strong>



雖然許多官媒時(shí)不時(shí)也提醒公眾,通用AI用于醫(yī)療場景存在明顯的不可靠性,但隨著AI技術(shù)精進(jìn)、使用人群越來越廣泛,AI確實(shí)正在進(jìn)入醫(yī)療決策的前置環(huán)節(jié)。

于是一個(gè)分化開始變得明顯起來。

一邊是通用大模型正在成為健康信息的第一入口,另一邊是醫(yī)療行業(yè)不斷強(qiáng)調(diào),通用模型不適合直接承擔(dān)醫(yī)療判斷。

所以我們討論的話題應(yīng)該再進(jìn)一步,聚焦在“哪一種AI有資格靠近醫(yī)療”?“我們到底需要什么樣的醫(yī)療AI”?

走向“能被病人托付”的醫(yī)療增強(qiáng)大模型M4

落地醫(yī)療場景的AI,必須要基于通用大模型做結(jié)構(gòu)性重構(gòu)與醫(yī)療專項(xiàng)增強(qiáng),方可真正服務(wù)醫(yī)療。

而百川智能推出的Baichuan-M4,正是在這個(gè)方向上的一次回答。

一直以來,百川在這方面的路徑清晰,從M1到M4,它始終在推動(dòng)通用大模型在醫(yī)療場景的能力邊界。

到了M3階段,這條路線開始真正收斂成體系,形成了一條清晰的能力基線,從而構(gòu)筑起由評測領(lǐng)先、范式原創(chuàng)、貼近臨床與外部驗(yàn)證四大要素共同支撐的信任體系。

M4在這條基線上的進(jìn)一步推進(jìn)。

我們可從最新發(fā)布的技術(shù)報(bào)告中一探究竟。

在最新評測體系中,M4繼續(xù)保持全球領(lǐng)先。

HealthBench綜合得分提升至68.6,Hard任務(wù)提升至49.7,幻覺率進(jìn)一步下降至3.3%。

在更貼近真實(shí)臨床環(huán)境的HealthBench Professional評測中,M4在基礎(chǔ)推理(不接外部工具)得分55.1,顯著高于GPT-5.5的51.8分。



但如果只看分?jǐn)?shù),這仍然只是連續(xù)優(yōu)化的結(jié)果。

M4真正的變化發(fā)生在能力結(jié)構(gòu)上,它開始從“單點(diǎn)問答優(yōu)化”走向“醫(yī)療過程能力重構(gòu)”。

這一變化,可以拆成四層升級。

會(huì)提問,從單輪問診走向深度診療

真實(shí)問診是個(gè)持續(xù)追問與信息補(bǔ)全的過程。

基于SCAN-bench 2.0體系,M4將訓(xùn)練場景從單次標(biāo)準(zhǔn)化問診擴(kuò)展到多輪訪視與復(fù)雜患者畫像,使模型能夠在信息不完整的情況下持續(xù)推進(jìn)診療路徑。

在動(dòng)態(tài)問診評測SCAN-bench中,M4初診得分79.0、復(fù)診74.7,均明顯領(lǐng)先其他頂尖模型;長上下文臨床記憶得分86.9,較上一代M3提升 21.1 分,為同類最高。

搭載了M4的百川C端產(chǎn)品百小醫(yī)上,能非常直觀地體現(xiàn)這項(xiàng)技能點(diǎn)的重要性。



張先生半夜突然急性腳痛,打開APP后,百小醫(yī)連續(xù)追問了10輪,逐步鎖定了痛風(fēng)風(fēng)險(xiǎn)。

敲黑板,“連續(xù)追問10輪”。

不是閑聊,它在通過連續(xù)追問補(bǔ)齊病史信息,逐漸縮小風(fēng)險(xiǎn)范圍。



模型在多輪對話中會(huì)持續(xù)追問TA的飲食結(jié)構(gòu)、發(fā)作頻率、用藥歷史以及近期指標(biāo)變化,系統(tǒng)逐步收斂風(fēng)險(xiǎn)判斷路徑,更接近真實(shí)門診的復(fù)診過程。

會(huì)循證,從內(nèi)容生成走向證據(jù)驅(qū)動(dòng)

“有沒有依據(jù)”是醫(yī)療判斷的關(guān)鍵。

在循證這一層,M4構(gòu)建了原子化臨床路徑體系,將復(fù)雜醫(yī)學(xué)指南拆解為1000余個(gè)可復(fù)用臨床決策單元,覆蓋200余種常見疾病的完整診療流程。

在此基礎(chǔ)上,研究團(tuán)隊(duì)還引入了更嚴(yán)格的證據(jù)錨定機(jī)制,使模型輸出穩(wěn)定對齊醫(yī)學(xué)證據(jù)。

很多通用模型也會(huì)在結(jié)論后甩一串文獻(xiàn),但點(diǎn)進(jìn)去常常對不上——要么引用編號在、內(nèi)容卻是兩回事,要么文獻(xiàn)本身沒錯(cuò)、被引的那段跟結(jié)論不沾邊。



證據(jù)錨定要做的,是讓每一句結(jié)論都能精確落到原文的具體段落,順著就能查到出處。

在Baichuan-EBM評測中,循證引用精度達(dá)到90.0,顯著高于GPT-5.5的54.7。

擁有Harness調(diào)度能力,持續(xù)提供健康管理服務(wù)

如果說問診解決的是單次決策問題,循證解決的是正確性問題,那么調(diào)度與記憶解決的是時(shí)間問題。

M4引入了Harness架構(gòu)。有了這個(gè)神經(jīng)中樞,何時(shí)追問、何時(shí)檢索證據(jù)、何時(shí)調(diào)出既往病史,均由模型自主決定,無需人工逐步指令。

面對文獻(xiàn)檢索、長病史梳理這類繁重任務(wù),它會(huì)拆分成子任務(wù)并行處理,讓模型專注于整體診療路徑的判斷;而每一步動(dòng)作,都在實(shí)時(shí)的安全約束下完成。

它會(huì)當(dāng)場攔下違規(guī)的工具調(diào)用、越權(quán)的數(shù)據(jù)訪問、不合臨床規(guī)范的操作等不安全的行為。

更重要的是,這套系統(tǒng)不是一次成型,而是在真實(shí)診療中持續(xù)迭代:線上的疑難案例、用戶的追問、醫(yī)生的糾偏,經(jīng)脫敏與歸因后回流,成為模型繼續(xù)改進(jìn)的依據(jù)。

問診、記憶、循證由此被編排成一個(gè)完整的整體,M4也從一個(gè)最強(qiáng)的醫(yī)療大腦,成為能獨(dú)立完成連續(xù)診療的醫(yī)療智能體。

全病程記憶,掌握患者上下文

真實(shí)的診療,很少在一次問診里就結(jié)束。

一次化驗(yàn)結(jié)果、一次用藥后的反應(yīng)、一個(gè)新冒出來的癥狀,都會(huì)隨病情推進(jìn)不斷改寫醫(yī)生的判斷——這意味著,能記住一個(gè)人完整的病史,才能給到患者更為準(zhǔn)確的建議。

針對這一點(diǎn),M4推出了“全病程記憶”,打通歷史病歷、多輪問診、化驗(yàn)趨勢與用藥反饋,讓模型在多次對話中始終掌握患者是誰、既往有過哪些疾病、各項(xiàng)指標(biāo)如何變化,而不必每次從零開始。

在長上下文臨床記憶評測中,M4取得86.9分,為同類最高,較上一代M3提升21.1分。

記住一個(gè)人完整的病程是精準(zhǔn)醫(yī)療的前提,好多關(guān)鍵價(jià)值都藏在不起眼的隨口閑聊里。



先舉個(gè)比較aha-moment的例子。

提前內(nèi)測的張強(qiáng)(化名),和父母分居兩地。某次家庭群聊天時(shí),老人隨口提了一句“最近走一圈就喘”。

基于M4模型的百小醫(yī)BOT隨后結(jié)合長期健康記錄與既往病史,提醒可能存在早期心功能不全風(fēng)險(xiǎn)。

然后打了波王牌輔助,輕松幾段話,就勸服張強(qiáng)媽媽就醫(yī)了。



換作只記短時(shí)對話的通用大模型,根本抓不住這種細(xì)碎線索。

在此背景下,百小醫(yī)這類C端產(chǎn)品形態(tài)的價(jià)值,開始出現(xiàn)。

張強(qiáng)媽媽最近很容易喘,百小醫(yī)在參考?xì)v史上下文給出健康提醒后,幫助張強(qiáng)說服老人去了醫(yī)院。

后續(xù)的院內(nèi)檢查結(jié)果,進(jìn)一步印證了此次就醫(yī)決策的必要性。

百小醫(yī)拿到報(bào)告后,還在繼續(xù)幫助張強(qiáng)管理家人的身體健康。

它把醫(yī)生之外那95%的診室外時(shí)間無縫銜接了:提醒、記錄、追問、預(yù)警,并在需要時(shí)把人重新推回線下就醫(yī)。



“主動(dòng)關(guān)心”這項(xiàng)技能點(diǎn)對醫(yī)療而言非常重要。

在中國醫(yī)學(xué)科學(xué)院腫瘤醫(yī)院的75個(gè)患者群測試中,多個(gè)群內(nèi)在27天里共產(chǎn)生6944條對話,百小醫(yī)安全性達(dá)到99.6%,深度互動(dòng)率達(dá)到60%-73%。

通過如此高頻的交互,百小醫(yī)能沉淀足夠多的健康上下文,讓M4在后續(xù)問診、提醒和風(fēng)險(xiǎn)識別中更有連續(xù)性。

某種程度上,這體現(xiàn)了百川想長期做的事情:

用M4提供專業(yè)大腦,用百小醫(yī)在家庭場景建立長期、連續(xù)的醫(yī)療關(guān)系。

最終的應(yīng)用形態(tài),便是和真人醫(yī)生形成“雙醫(yī)模式”:醫(yī)生負(fù)責(zé)診斷與治療決策,AI負(fù)責(zé)診室外的長期陪伴、信息整理和風(fēng)險(xiǎn)提醒。

醫(yī)療推理能力,保證模型輸出穩(wěn)定性

當(dāng)然,模型能力才是支撐這一切的基石。

在復(fù)雜醫(yī)療問題上,M4進(jìn)一步強(qiáng)化多模態(tài)能力。

在多模態(tài)能力方面,復(fù)雜檢驗(yàn)報(bào)告和化驗(yàn)單的結(jié)構(gòu)化識別得分0.914,能夠較好支持醫(yī)學(xué)影像與結(jié)構(gòu)化報(bào)告理解,使模型在復(fù)雜信息輸入條件下仍保持穩(wěn)定判斷能力。

這一部分能力更多作為補(bǔ)強(qiáng),保證模型在復(fù)雜醫(yī)療場景中的穩(wěn)定性。

整體來看,M4在M3形成的醫(yī)療專用基線上,完成了一次系統(tǒng)性的能力重構(gòu)。

它讓醫(yī)療AI從“回答問題”走向“參與診療過程”,從“單次交互”走向“連續(xù)托付”。

作為一家通用大模型公司,百川將旗下最強(qiáng)的模型能力投向了醫(yī)療這樣高風(fēng)險(xiǎn)、高復(fù)雜度的場景。

醫(yī)療不是賽道,是一道考題

過去兩年,大模型行業(yè)其實(shí)一直有一個(gè)爭議:醫(yī)療,到底只是大模型的一個(gè)應(yīng)用方向,還是值得單獨(dú)重做一套模型體系?

如今看來,百川的標(biāo)簽,可能首先是“通用大模型”。

只不過他們選了最難的醫(yī)療場景,作為檢驗(yàn)這個(gè)“通用大模型”的考場。

百小醫(yī)——這個(gè)能和患者深度建聯(lián)的C端產(chǎn)品,正是這個(gè)判斷的最佳印證。

它有Chatbot有的一切,但又全棧圍繞醫(yī)療用途重構(gòu)。

因?yàn)樗某霈F(xiàn),一整套專業(yè)級醫(yī)療模型能力,第一次開始進(jìn)入普通家庭。



這是一件很有意義的事,多年以來,家庭一直是醫(yī)療語境下被忽略的場景,許多珍貴的上下文未能被記錄沉淀。

如今,百小醫(yī)正在填上這一缺口。



  • 中國醫(yī)學(xué)科學(xué)院腫瘤醫(yī)院:腫瘤科;
  • 首都醫(yī)科大學(xué)附屬北京兒童醫(yī)院:兒科;
  • 上海交通大學(xué)瑞金醫(yī)院:呼吸與危重癥醫(yī)學(xué)科。

北兒、東腫、瑞金……百川的AI家庭醫(yī)生,已在最嚴(yán)苛的臨床場景跑通。

而這還只是開始。

再往外延伸,藥企、醫(yī)療器械廠商、體檢機(jī)構(gòu)……這些過去跟患者之間隔著好幾層信息壁壘的角色,未來都有可能通過AI家庭醫(yī)生這個(gè)入口,更精準(zhǔn)地觸達(dá)用戶需求,提供更有針對性的服務(wù)。

一個(gè)圍繞AI家庭醫(yī)生的醫(yī)療健康新生態(tài),正在長出來。

醫(yī)療從來都不是一個(gè)只屬于醫(yī)院的事情。

它發(fā)生在凌晨三點(diǎn)的焦慮里,發(fā)生在家庭群里那句“醫(yī)生到底怎么說”里,也發(fā)生在很多人看不懂檢查單、卻只能默默回家的路上。

過去這些時(shí)刻,大多數(shù)人只能靠自己。

但如果它真的能讓更多人少一點(diǎn)慌張、少一點(diǎn)信息鴻溝、少走一點(diǎn)彎路,甚至只是讓異地生活的子女,對父母的身體狀況多一點(diǎn)安心……這件事本身,已經(jīng)很重要了。

M4是大腦,百小醫(yī)是身體。

前者證明通用大模型能在最難的醫(yī)療場景里完成專業(yè)推理、循證和長期記憶。

后者,把這種能力送到家庭、微信群和每一次真實(shí)的健康決策里。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
B費(fèi)社媒遭攻陷:自私+故意不傳球!怕C羅世界杯發(fā)光 總裁親姐點(diǎn)贊

B費(fèi)社媒遭攻陷:自私+故意不傳球!怕C羅世界杯發(fā)光 總裁親姐點(diǎn)贊

我愛英超
2026-06-18 21:36:54
高市早苗稱“非常擔(dān)心”中國對日本的稀土出口限制措施,外交部:她一邊喊著對話,一邊忙著對抗,完全是自相矛盾

高市早苗稱“非常擔(dān)心”中國對日本的稀土出口限制措施,外交部:她一邊喊著對話,一邊忙著對抗,完全是自相矛盾

日照日報(bào)
2026-06-18 16:31:03
安徽情侶自駕3.5萬公里旅行結(jié)婚,耗時(shí)100天經(jīng)17省市,“囍”字寫滿陌生人祝福

安徽情侶自駕3.5萬公里旅行結(jié)婚,耗時(shí)100天經(jīng)17省市,“囍”字寫滿陌生人祝福

瀟湘晨報(bào)
2026-06-18 17:41:20
成品油價(jià)降回7元時(shí)代

成品油價(jià)降回7元時(shí)代

界面新聞
2026-06-18 15:01:31
鄭欽文排名斷崖式下跌:資本迅速撤離,曾經(jīng)追捧她的品牌去哪了

鄭欽文排名斷崖式下跌:資本迅速撤離,曾經(jīng)追捧她的品牌去哪了

財(cái)經(jīng)保探長
2026-06-18 23:35:15
世界杯開戰(zhàn)一周,青島啤酒先扛不住了

世界杯開戰(zhàn)一周,青島啤酒先扛不住了

金角財(cái)經(jīng)
2026-06-18 15:54:28
亨利:葡萄牙需要的是進(jìn)球,C羅擋住了B費(fèi)的必進(jìn)球

亨利:葡萄牙需要的是進(jìn)球,C羅擋住了B費(fèi)的必進(jìn)球

懂球帝
2026-06-18 15:06:15
梁文鋒為什么選了劉強(qiáng)東,沒選馬云?

梁文鋒為什么選了劉強(qiáng)東,沒選馬云?

帥真商業(yè)
2026-06-18 10:20:26
網(wǎng)曝蘇州企業(yè)把工人換成印度人!工資僅國人的一半,福利待遇很好

網(wǎng)曝蘇州企業(yè)把工人換成印度人!工資僅國人的一半,福利待遇很好

小徐講八卦
2026-06-18 19:24:00
哥倫比亞3比1戰(zhàn)勝烏茲別克斯坦,力壓葡萄牙暫列小組第一

哥倫比亞3比1戰(zhàn)勝烏茲別克斯坦,力壓葡萄牙暫列小組第一

澎湃新聞
2026-06-18 12:04:31
1-1!捷克隊(duì)保守付代價(jià),南非隊(duì)點(diǎn)球絕平,兩隊(duì)菜雞互啄都走不遠(yuǎn)

1-1!捷克隊(duì)保守付代價(jià),南非隊(duì)點(diǎn)球絕平,兩隊(duì)菜雞互啄都走不遠(yuǎn)

硬腿子聊個(gè)球
2026-06-19 01:58:44
奉陪到底!中方強(qiáng)勢取消3500億美芯訂單,馬斯克:這只是個(gè)開始

奉陪到底!中方強(qiáng)勢取消3500億美芯訂單,馬斯克:這只是個(gè)開始

荒野科技
2026-06-18 20:14:11
羅翔說:電視上演的都是,給你多少萬,離開我女兒;而現(xiàn)實(shí)中卻是,給我們多少萬,否則離開我女兒

羅翔說:電視上演的都是,給你多少萬,離開我女兒;而現(xiàn)實(shí)中卻是,給我們多少萬,否則離開我女兒

背包旅行
2026-06-18 14:23:32
沉默45年,中國第二輪"嚴(yán)打"終于來了!目標(biāo)改變總體戰(zhàn)正式打響

沉默45年,中國第二輪"嚴(yán)打"終于來了!目標(biāo)改變總體戰(zhàn)正式打響

職場資深秘書
2026-06-15 16:41:48
深夜白云機(jī)場大批老外被當(dāng)場勸返!別再天真以為:有簽證就能入境

深夜白云機(jī)場大批老外被當(dāng)場勸返!別再天真以為:有簽證就能入境

行者聊官
2026-06-18 09:58:27
SpaceX,股價(jià)大跌

SpaceX,股價(jià)大跌

澎湃新聞
2026-06-19 01:02:18
乘坐飛機(jī),發(fā)現(xiàn)一個(gè)空姐很像豆包,蚌埠住了。

乘坐飛機(jī),發(fā)現(xiàn)一個(gè)空姐很像豆包,蚌埠住了。

微微熱評
2026-06-18 12:42:56
韓媒:韓國足壇的奇恥大辱——中國足球裁判時(shí)隔24年擔(dān)任世界杯主裁

韓媒:韓國足壇的奇恥大辱——中國足球裁判時(shí)隔24年擔(dān)任世界杯主裁

寶哥精彩賽事
2026-06-18 10:24:39
某高考生自曝提前10天知曉成績,被質(zhì)疑后放話:我爸是教育局的

某高考生自曝提前10天知曉成績,被質(zhì)疑后放話:我爸是教育局的

西虹市閑話
2026-06-18 17:28:27
轟動(dòng)全網(wǎng)的北京“退衣姐”被刑拘事件:我們還是低估了這群人的不要臉

轟動(dòng)全網(wǎng)的北京“退衣姐”被刑拘事件:我們還是低估了這群人的不要臉

桌子的生活觀
2026-06-18 12:30:11
2026-06-19 03:52:49
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
12816文章數(shù) 176500關(guān)注度
往期回顧 全部

科技要聞

庫克承認(rèn)扛不住了,蘋果漲價(jià)“不可避免”

頭條要聞

159瓶茅臺(tái)被扣3年后多瓶失蹤 警方:酒仍處于扣押時(shí)狀態(tài)

頭條要聞

159瓶茅臺(tái)被扣3年后多瓶失蹤 警方:酒仍處于扣押時(shí)狀態(tài)

體育要聞

英格蘭不再九子奪嫡,凱恩才是唯一真神

娛樂要聞

39歲梅西不愧是人生贏家!

財(cái)經(jīng)要聞

博??礗PO,賺錢業(yè)務(wù)與資本敘事是兩門生意

汽車要聞

驚出冷汗!重慶實(shí)測奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

游戲
數(shù)碼
藝術(shù)
健康
公開課

PS5版《GTA6》已有店家開始預(yù)定!售價(jià)545元

數(shù)碼要聞

銘瑄公布MCIO接口ITX主板方案,展示高密度接口優(yōu)勢

藝術(shù)要聞

臺(tái)北東區(qū)新門戶!南港雙星,像一道“城市裂痕”

吃粽子的3條保胃法則,消化科醫(yī)生推薦

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版