免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

性能碾壓谷歌!5000億美元巨頭開源最強(qiáng)端側(cè)醫(yī)療AI,背后藏著一家中國企業(yè)!

0
分享至

一家估值超5000億美元的幣圈富豪公司,秀出了性能碾壓谷歌的AI醫(yī)療大模型。

近日,以發(fā)行全球最大穩(wěn)定幣USDT聞名的Tether推出了AI醫(yī)療大模型QVAC MedPsy,并在多項(xiàng)醫(yī)學(xué)推理與診斷基準(zhǔn)測試中展現(xiàn)出令人意外的強(qiáng)大性能:

這款僅1.7B參數(shù)的輕量級(jí)模型,擊敗了規(guī)模大16倍的谷歌MedGemma-27B;且4B版本使用的token比主流模型少3.2倍,在降低計(jì)算成本的同時(shí)保持了較高的輸出質(zhì)量。

這一結(jié)果,直接挑戰(zhàn)了AI醫(yī)療領(lǐng)域長期存在的“模型規(guī)模越大,效果越好”的共識(shí),在官方技術(shù)通稿中,Tether AI團(tuán)隊(duì)強(qiáng)調(diào),該模型更接近一種“輕量級(jí)高密度推理系統(tǒng)”。


不少開發(fā)者社區(qū)也對(duì)其“低參數(shù)、高性能”的組合方式給予了積極評(píng)價(jià),認(rèn)為其可能代表醫(yī)療大模型的一條新路徑。

值得關(guān)注的是,Tether旗下AI團(tuán)隊(duì)在2024年才啟動(dòng)招募,成立時(shí)間極短。從其官網(wǎng)披露的技術(shù)說明與開源鏈路來看,QVAC MedPsy的訓(xùn)練并非完全從零開始構(gòu)建,而是在多個(gè)基礎(chǔ)模型之上進(jìn)行組合式訓(xùn)練與優(yōu)化。


進(jìn)一步追溯其論文與技術(shù)報(bào)告可以發(fā)現(xiàn),在封閉式醫(yī)學(xué)基準(zhǔn)測試與HealthBench評(píng)估框架中,Tether團(tuán)隊(duì)實(shí)際采用了來自中國公司的開源醫(yī)療大模型——百川智能Baichuan-M3-235B作為自己的“教師模型”。


中國大模型的持久統(tǒng)治力

在Tether團(tuán)隊(duì)的內(nèi)部模型篩選中,Baichuan-M3同臺(tái)競技的對(duì)手包括OpenAI的GPT-OSS-120B以及量化巨頭旗下Ubiquant AI推出的Fleming-R1-32B。

而Baichuan-M3-235B在幾乎所有核心評(píng)測指標(biāo)上都展現(xiàn)出明顯優(yōu)勢,尤其是在高復(fù)雜度醫(yī)學(xué)問題上的表現(xiàn),拉開了顯著差距。

其中,最值得關(guān)注的是醫(yī)學(xué)推理基準(zhǔn)MedXpertQA。

這是目前業(yè)內(nèi)公認(rèn)難度最高的醫(yī)學(xué)多選評(píng)測之一,相比傳統(tǒng)基于USMLE題庫的MedQA,它更強(qiáng)調(diào)復(fù)雜臨床推理、多學(xué)科診斷與長鏈路決策能力,某種程度上,更接近頂級(jí)醫(yī)院MDT(多學(xué)科會(huì)診)場景下的真實(shí)醫(yī)學(xué)判斷。

在這一基準(zhǔn)上,Baichuan-M3相比競品取得了高達(dá)10.98分的領(lǐng)先優(yōu)勢。對(duì)于醫(yī)療AI而言,這已經(jīng)不是簡單的“精度提升”,而是意味著模型在復(fù)雜病情理解、診療邏輯組織以及醫(yī)學(xué)知識(shí)調(diào)用能力上,出現(xiàn)了代際差異。

不僅如此,在經(jīng)典大模型評(píng)測MMLU-Pro Health上,Baichuan-M3同樣展現(xiàn)出顯著領(lǐng)先,分別取得了+5.05 / +2.73的優(yōu)勢表現(xiàn)。

事實(shí)上,早在2026年1月首次發(fā)布時(shí),Baichuan-M3就已經(jīng)在全球權(quán)威醫(yī)療AI評(píng)測基準(zhǔn) HealthBench上擊敗GPT-5.2,并刷新當(dāng)時(shí)最高紀(jì)錄。更難得的是,在AI行業(yè)已經(jīng)進(jìn)入“月更時(shí)代”的背景下,這一優(yōu)勢并未隨著時(shí)間迅速衰減。

具體來看,Baichuan-M3-235B相較GPT-OSS-120B領(lǐng)先約6至12分,相較Fleming-R1-32B領(lǐng)先約10至12分,并且在HealthBench全部七個(gè)維度上都維持了持續(xù)性的優(yōu)勢。


Tether團(tuán)隊(duì)對(duì)Baichuan-M3模型的評(píng)價(jià)

這種持續(xù)領(lǐng)先的背后,是百川在醫(yī)療強(qiáng)化學(xué)習(xí)體系上的長期投入。

從2025年M2開始,百川便將原本依賴患者模擬器與靜態(tài)Rubric的半動(dòng)態(tài)反饋機(jī)制,升級(jí)為能夠隨模型能力共同演化的全動(dòng)態(tài)Verifier System。隨著監(jiān)督信號(hào)不斷細(xì)化、難化,模型得以持續(xù)突破能力上限,最終讓M3在復(fù)雜醫(yī)學(xué)推理與醫(yī)療溝通能力上實(shí)現(xiàn)躍遷。

與此同時(shí),M3還首次具備了原生“端到端”嚴(yán)肅問診能力。它能夠像真實(shí)醫(yī)生一樣主動(dòng)追問、逐層逼近病因,把關(guān)鍵病史和風(fēng)險(xiǎn)信號(hào)一步步問出來,再基于完整信息進(jìn)行深度醫(yī)學(xué)推理。

這也是為什么,Tether團(tuán)隊(duì)并不是Baichuan-M系列模型唯一的支持者。Baichuan-M系列模型在開源社區(qū)累計(jì)獲得超過150萬次下載,同時(shí)受益于百川推出的「海納百川」計(jì)劃,M3 Plus API已向服務(wù)醫(yī)務(wù)工作者的機(jī)構(gòu)免費(fèi)開放,目前已有大量團(tuán)隊(duì)基于該模型構(gòu)建醫(yī)療應(yīng)用。

甚至在今年3月OpenAI發(fā)布GPT-5.4后,仍有不少開發(fā)者在社區(qū)中呼吁,希望GPT系列與Baichuan-M3在HealthBench上展開正面對(duì)決,并質(zhì)疑GPT在醫(yī)療健康領(lǐng)域的真實(shí)能力,是否已經(jīng)被中國醫(yī)療大模型反超。


正如百川智能創(chuàng)始人、 CEO王小川在媒體采訪中表達(dá)的:“(AI醫(yī)療)護(hù)城河核心肯定在于模型能力的絕對(duì)領(lǐng)先,在醫(yī)療這一嚴(yán)肅領(lǐng)域,只有領(lǐng)先一代的技術(shù)水平才能建立行業(yè)信任 。”


重構(gòu)專業(yè)醫(yī)療的“數(shù)字基建”

當(dāng)大模型浪潮席卷各行各業(yè)時(shí),真正能切入醫(yī)療AI的公司并不多,百川智能算是其中最早的一批。

早在2023年,百川智能成立后迅速躋身國內(nèi)大模型賽道的前列。到了2025年,百川智能明確了“為人類造醫(yī)生、為生命建模型”的核心路徑,其發(fā)布的模型幾乎全部圍繞醫(yī)療場景和推理能力增強(qiáng)展開。

同年10月,百川推出首個(gè)循證增強(qiáng)醫(yī)療大模型Baichuan-M2 Plus,在幻覺率控制上明顯優(yōu)于通用大模型,降低至Deepseek的三分之一,可信度接近資深臨床醫(yī)生水準(zhǔn)。

年底,百川智能發(fā)布醫(yī)療Agent平臺(tái)PAPA(PlayBook Animated Proactive Agent),能夠從提醒用藥到動(dòng)態(tài)調(diào)整健康計(jì)劃,實(shí)現(xiàn)月度乃至年度的患者康復(fù)進(jìn)程管理,真正將AI嵌入臨床閉環(huán)。

隨后登場的醫(yī)療大模型Baichuan-M3更一鳴驚人。在全球權(quán)威醫(yī)療評(píng)測 HealthBench 中以 65.1分 登頂,首次全面超越 GPT-5.2,并刷新了醫(yī)療幻覺率最低記錄。

2026年以來,醫(yī)療健康已成為AI最受重視的落地領(lǐng)域之一。OpenAI推出“個(gè)人超級(jí)健康助手”ChatGPT Health,谷歌發(fā)布最新開源醫(yī)療模型MedGemma 1.5,Anthropic也掏出Claude for Healthcare來搶占醫(yī)療市場。

不同于通用大模型“先做能力、再找場景”的路徑,百川智能選擇深耕醫(yī)療垂類,圍繞臨床真實(shí)需求打磨產(chǎn)品,持續(xù)突破低幻覺率、端到端問診和復(fù)雜臨床推理等核心能力。

百川智能構(gòu)建的深度問診”能力,讓模型在有限對(duì)話輪次中,將臨床所需問題問全、問準(zhǔn),其表現(xiàn)甚至顯著高于人類醫(yī)生基線。

首創(chuàng)的“證據(jù)錨定”技術(shù),不僅提供引文來源,還將每一句醫(yī)學(xué)結(jié)論精確映射到原始論文的對(duì)應(yīng)段落,使AI的醫(yī)學(xué)判斷可核驗(yàn)、可追責(zé)、可教學(xué),極大增強(qiáng)了臨床可信度。

這也讓百川智能在醫(yī)療AI行業(yè)進(jìn)入深水區(qū)后,逐漸形成差異化優(yōu)勢——不僅有強(qiáng)大模型能力,更熟悉醫(yī)院工作流,更貼近真實(shí)臨床場景。

在政策支持、醫(yī)院數(shù)智化升級(jí)與大模型能力突破的多重推動(dòng)下,醫(yī)療AI正在進(jìn)入真正的產(chǎn)業(yè)化周期。而提前完成垂類深耕、建立技術(shù)與場景閉環(huán)的百川智能,顯然已經(jīng)站在了更有利的位置。

此外,據(jù)智藥局獲悉,百川智能即將發(fā)布AI醫(yī)療應(yīng)用產(chǎn)品與新一代大模型,其應(yīng)用表現(xiàn)與技術(shù)成果值得高度期待。

—The End—

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
SpaceX“變臉”!股價(jià)兩連跌,散戶賬面收益幾近蒸發(fā)

SpaceX“變臉”!股價(jià)兩連跌,散戶賬面收益幾近蒸發(fā)

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-06-19 18:19:18
“我中招了,都是在小藍(lán)上亂來的結(jié)果”!20歲小伙哭訴撞上HIV

“我中招了,都是在小藍(lán)上亂來的結(jié)果”!20歲小伙哭訴撞上HIV

火山詩話
2026-06-18 10:12:31
孩子頻繁說這幾句話,不是矯情,是在向你求救!很多家長都聽不懂

孩子頻繁說這幾句話,不是矯情,是在向你求救!很多家長都聽不懂

戶外阿毽
2026-06-19 04:05:57
北京老太太帶“金釵”鑒寶,專家說假的,她平和的說:可知我母親是誰?專家立馬改口

北京老太太帶“金釵”鑒寶,專家說假的,她平和的說:可知我母親是誰?專家立馬改口

LULU生活家
2026-06-17 19:11:39
曹圭成:作為前鋒我本應(yīng)該把握住機(jī)會(huì)進(jìn)球,但我沒能做到

曹圭成:作為前鋒我本應(yīng)該把握住機(jī)會(huì)進(jìn)球,但我沒能做到

懂球帝
2026-06-19 18:21:22
斯科爾斯評(píng)C羅世界杯啞火:41歲踢中鋒,跑動(dòng)成硬傷

斯科爾斯評(píng)C羅世界杯啞火:41歲踢中鋒,跑動(dòng)成硬傷

體育硬核說
2026-06-20 00:59:50
四位美國第一夫人同框!米歇爾瘦脫相,希拉里老態(tài)盡顯,勞拉優(yōu)雅

四位美國第一夫人同框!米歇爾瘦脫相,希拉里老態(tài)盡顯,勞拉優(yōu)雅

鍋鍋愛歷史
2026-06-20 03:22:55
采訪了100位當(dāng)代女性,她們都認(rèn)為女人最快活的時(shí)候,就是被人撩

采訪了100位當(dāng)代女性,她們都認(rèn)為女人最快活的時(shí)候,就是被人撩

千秋文化
2026-06-11 17:50:56
大批網(wǎng)約車司機(jī)翻車!早年跟風(fēng)買運(yùn)電車,如今進(jìn)退兩難熬不下去

大批網(wǎng)約車司機(jī)翻車!早年跟風(fēng)買運(yùn)電車,如今進(jìn)退兩難熬不下去

老特有話說
2026-06-18 14:49:24
央視怒批,目不識(shí)丁,洋相百出,絕望文盲再翻車,馮遠(yuǎn)征又說對(duì)了

央視怒批,目不識(shí)丁,洋相百出,絕望文盲再翻車,馮遠(yuǎn)征又說對(duì)了

墨印齋
2026-05-29 13:20:21
保姆給中風(fēng)父親洗澡,每次都要兩小時(shí),我打開監(jiān)控一看,果斷報(bào)警

保姆給中風(fēng)父親洗澡,每次都要兩小時(shí),我打開監(jiān)控一看,果斷報(bào)警

千秋文化
2026-05-27 20:02:00
我們都在喊內(nèi)需不足,卻忘了中國還有4.65億人沒“進(jìn)場”

我們都在喊內(nèi)需不足,卻忘了中國還有4.65億人沒“進(jìn)場”

文青大叔說
2026-06-19 08:54:48
孫浩今年58歲沒結(jié)過婚,拍完《主角》后他買了張硬座回老家了……

孫浩今年58歲沒結(jié)過婚,拍完《主角》后他買了張硬座回老家了……

手工制作阿殲
2026-06-11 10:47:53
被俄羅斯吞并370年,為何他們卻拒絕俄化、心向中國?卡爾梅克

被俄羅斯吞并370年,為何他們卻拒絕俄化、心向中國?卡爾梅克

深析古今
2026-06-19 07:18:18
忙活一桌子,狗都不吃!丈夫過生日,妻子自我感動(dòng) ,網(wǎng)友吐槽

忙活一桌子,狗都不吃!丈夫過生日,妻子自我感動(dòng) ,網(wǎng)友吐槽

蝴蝶花雨話教育
2026-05-31 00:05:20
中醫(yī):凡是夜尿超過2次、睡不踏實(shí)者,多是腎氣不固,一招改善

中醫(yī):凡是夜尿超過2次、睡不踏實(shí)者,多是腎氣不固,一招改善

牛鍋巴小釩
2026-06-18 15:20:57
曝森林北母女定居北京,女兒學(xué)費(fèi)26萬接娃放學(xué)拎愛馬仕

曝森林北母女定居北京,女兒學(xué)費(fèi)26萬接娃放學(xué)拎愛馬仕

最美的筆觸
2026-06-18 18:57:24
我在上海帶孫子,博士后兒媳給我上了一課,她講的3句話讓我懵了

我在上海帶孫子,博士后兒媳給我上了一課,她講的3句話讓我懵了

城事錄主
2025-06-04 09:21:46
紫色的線條里,全是自律內(nèi)卷的肌理

紫色的線條里,全是自律內(nèi)卷的肌理

梅梅聊點(diǎn)實(shí)尚嗑
2026-06-17 07:48:21
女子因鉀過低心臟驟停,醫(yī)生:平時(shí)寧愿少吃點(diǎn)肉,也要多吃這5物

女子因鉀過低心臟驟停,醫(yī)生:平時(shí)寧愿少吃點(diǎn)肉,也要多吃這5物

芹姐說生活
2026-06-10 14:57:32
2026-06-20 05:27:00
智藥局 incentive-icons
智藥局
我們更懂藥物創(chuàng)新
1207文章數(shù) 220關(guān)注度
往期回顧 全部

科技要聞

Anthropic被禁,智譜卻漲瘋了

頭條要聞

特朗普:伊朗走投無路徹底完蛋了 我們就把這60天耗完

頭條要聞

特朗普:伊朗走投無路徹底完蛋了 我們就把這60天耗完

體育要聞

世界杯最不知名球員,沒上場先漲粉600萬

娛樂要聞

孫藝珍曬母子合照!4歲小甜豆暴風(fēng)成長

財(cái)經(jīng)要聞

Token低價(jià)陷阱

汽車要聞

驚出冷汗!重慶實(shí)測奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

房產(chǎn)
本地
游戲
數(shù)碼
軍事航空

房產(chǎn)要聞

商業(yè)清零式退潮,大量住宅登場!三亞又要大規(guī)模調(diào)規(guī)!

本地新聞

世界杯黑馬佛得角:河北人開超市,溫州人當(dāng)老板

任天堂完全獨(dú)占新游開預(yù)購!7月23日發(fā)售 女主好性感

數(shù)碼要聞

SSD太貴換回HDD:機(jī)械硬盤價(jià)格連漲5個(gè)季度!

軍事要聞

霸氣!端午節(jié)最硬核的“龍舟”競渡來了

無障礙瀏覽 進(jìn)入關(guān)懷版