免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

摩爾線程 × 智源|FlagOS AI訓(xùn)練“全要素”驗證成績單

0
分享至

近日,北京智源人工智能研究院(簡稱:智源研究院)正式發(fā)布重磅驗證成果:六款A(yù)I芯片、三大模型、同構(gòu)+異構(gòu)千卡——眾智FlagOS以統(tǒng)一技術(shù)棧完成AI訓(xùn)練“全要素”驗證。

作為本次驗證的核心參與廠商之一,摩爾線程基于旗艦級AI訓(xùn)推一體全功能GPU智算卡MTT S5000,完整適配了FlagOS訓(xùn)練全要素軟件棧——包括FlagScale系統(tǒng)調(diào)度決策框架、Megatron-LM分布式訓(xùn)練框架、Transformer Engine加速庫、FlagGems與Triton算子庫,以及FlagCX通信庫。

在此次嚴(yán)苛的驗證中,MTT S5000面向Qwen3-0.6B語言模型完成了1T Tokens從頭訓(xùn)練驗證,實現(xiàn)連續(xù)6天以上、超過14000步的無中斷穩(wěn)定訓(xùn)練。訓(xùn)練所得模型 Loss 曲線與基線高度一致,平均相對誤差控制在0.82%以內(nèi);在標(biāo)準(zhǔn)下游任務(wù)評測中,較行業(yè)標(biāo)桿基線提升1.65個百分點,充分驗證了全功能GPU算力在大模型端到端訓(xùn)練中的穩(wěn)定性與有效性。



長周期高負載驗證:

4機32卡無中斷,6+天穩(wěn)定訓(xùn)練

此次FlagOS全要素適配與驗證工作,旨在檢驗多元AI算力在統(tǒng)一軟件棧下的端到端訓(xùn)練能力。摩爾線程與智源團隊緊密協(xié)作,高效完成了底層適配與系統(tǒng)調(diào)優(yōu),并于春節(jié)前正式啟動全流程訓(xùn)練驗證。

在實際訓(xùn)練中,摩爾線程采用4機32卡配置,面向 Qwen3-0.6B語言模型開展訓(xùn)練。在超過6天的連續(xù)訓(xùn)練周期內(nèi),系統(tǒng)穩(wěn)定完成 1T Tokens 數(shù)據(jù)量的超過14000步迭代,期間未發(fā)生任何軟硬件中斷。這一結(jié)果回應(yīng)了業(yè)界對國產(chǎn)算力大規(guī)模訓(xùn)練穩(wěn)定性的核心關(guān)切,也進一步證明了基于MTT S5000構(gòu)建的訓(xùn)練集群在長時間、高負載場景下的可靠性,充分驗證國產(chǎn)算力已具備支撐企業(yè)級大模型預(yù)訓(xùn)練任務(wù)的能力。

精度穩(wěn)定對齊:

Loss曲線高度一致,評測效果優(yōu)于基線

大模型訓(xùn)練的核心訴求,不僅在于算力規(guī)模與性能,更在于訓(xùn)練過程中的穩(wěn)定性、收斂效果和最終模型質(zhì)量。其中,訓(xùn)練精度是基石,下游任務(wù)評測效果則是檢驗訓(xùn)練成效的關(guān)鍵指標(biāo)。

在FlagOS統(tǒng)一軟件棧的調(diào)度下,采用完全對齊的數(shù)據(jù)集和訓(xùn)練參數(shù),基于MTT S5000集群的訓(xùn)練過程呈現(xiàn)出與國際主流產(chǎn)品基線高度一致的Loss收斂曲線,平均相對誤差控制在0.82%以內(nèi)。與此同時,在標(biāo)準(zhǔn)的下游任務(wù)評測中,基于MTT S5000訓(xùn)練的模型,取得了比行業(yè)標(biāo)桿基線高出1.65個百分點的結(jié)果表現(xiàn)。

與基線評測偏差的計算方法(后面的計算方式類似):



Qwen3-0.6B評測結(jié)果(正數(shù)是優(yōu)于基線)



這一結(jié)果表明,開發(fā)者基于公開的模型結(jié)構(gòu)與數(shù)據(jù)集,即可在摩爾線程MTT S5000算力平臺上,獲得與國際主流平臺精度相當(dāng),并在部分評測指標(biāo)上實現(xiàn)更優(yōu)表現(xiàn)的大模型訓(xùn)練效果。

此外,摩爾線程基于MTT S5000的訓(xùn)練能力已在更大規(guī)模場景中得到驗證。今年1月,依托摩爾線程MTT S5000千卡智算集群,FlagOS成功完成智源自研具身大腦模型RoboBrain 2.5的全流程訓(xùn)練與優(yōu)化驗證。結(jié)果顯示,其Loss曲線與國際主流產(chǎn)品基線高度一致,最終結(jié)果相對誤差小于0.62%;在64卡至1024卡規(guī)模區(qū)間內(nèi),多組實驗均實現(xiàn)超過90%的線性擴展效率。該案例表明,摩爾線程基于MTT S5000的訓(xùn)練能力不僅可支撐長周期端到端驗證,也具備向更大規(guī)模、更復(fù)雜模型場景持續(xù)延展的能力。

RoboBrain2.5模型評測效果



端到端訓(xùn)練Loss曲線



軟硬創(chuàng)新協(xié)同:

打造高質(zhì)量大模型訓(xùn)練底座

此次驗證成績的取得,離不開摩爾線程在芯片架構(gòu)、通信能力、計算單元協(xié)同以及FP8訓(xùn)練支持等方面的持續(xù)打磨?;贛TT S5000,摩爾線程正不斷完善面向大模型訓(xùn)練的軟硬件能力,為訓(xùn)練穩(wěn)定性、精度表現(xiàn)和規(guī)模擴展提供堅實支撐。

▼架構(gòu)級精度優(yōu)化:深入打磨矩陣乘法(GEMM)算子

矩陣乘法(GEMM)是大模型訓(xùn)練中的核心算子之一,其數(shù)值精度直接影響Loss曲線的收斂表現(xiàn)與最終模型效果。圍繞這一關(guān)鍵環(huán)節(jié),摩爾線程團隊在MTT S5000的架構(gòu)設(shè)計階段,便針對浮點運算的舍入模式、累加路徑等關(guān)鍵計算鏈路進行了精細化優(yōu)化。這種來自架構(gòu)層面的持續(xù)打磨,使得MTT S5000在長時間訓(xùn)練過程中保持更穩(wěn)定的數(shù)值表現(xiàn),為模型訓(xùn)練精度對齊及下游評測效果提升提供了堅實的底層保障。

▼ACE異步通信引擎:讓計算與通信更高效并行

在大規(guī)模分布式并行訓(xùn)練中,卡間通信往往會與計算任務(wù)爭搶帶寬及核心資源,成為制約擴展效率的瓶頸。MTT S5000創(chuàng)新性地內(nèi)置了ACE(Asynchronous Communication Engine,異步通信引擎),作為獨立的硬件通信單元,能夠在不占用計算核心資源的情況下,高效完成跨卡間的all_reduce、all_gather等集合通信操作。得益于ACE,通信與計算得以更深度地并行協(xié)同——當(dāng)Tensor Core(張量計算核心)在進行繁重的矩陣運算時,ACE已在后臺并行完成梯度同步,為大規(guī)模訓(xùn)練帶來更高的資源利用效率。摩爾線程在千卡規(guī)模訓(xùn)練中能保持超過90%的線性擴展效率,正是這一設(shè)計優(yōu)勢的重要體現(xiàn)。

▼多計算單元協(xié)同:Tensor Core與Vector Core高效配合

為了更好適配大模型訓(xùn)練中多樣化的計算負載,MTT S5000在算力單元的設(shè)計上,對Tensor Core與Vector Core(向量計算單元)進行了針對性的配置與協(xié)同優(yōu)化。在實際調(diào)度中,密集的矩陣運算交給Tensor Core處理,而LayerNorm、Softmax、激活函數(shù)等偏向內(nèi)存或帶寬密集型算子則交由Vector Core高效執(zhí)行?;谶@一硬件特性,摩爾線程聯(lián)合智源團隊對FlagOS進行了深度的軟件棧調(diào)優(yōu),最終在FlashAttention等關(guān)鍵算子上實現(xiàn)了超過90%的計算資源利用率,進一步釋放了平臺的訓(xùn)練潛力。

▼原生FP8支持:協(xié)同MT-Megatron穩(wěn)定高效釋放Grouped GEMM潛力

隨著模型參數(shù)規(guī)模邁入千億甚至萬億級別,低精度訓(xùn)練已成為提升訓(xùn)練效率的重要方向。MTT S5000在硬件層面原生支持FP8數(shù)據(jù)精度,為更高吞吐的大模型訓(xùn)練提供了基礎(chǔ)能力。通過底層算子庫的高效優(yōu)化,其FP8 Grouped GEMM性能在實際場景中取得了超過700TFLOPs的性能表現(xiàn)。同時,摩爾線程對MT-Megatron分布式訓(xùn)練框架進行了深度適配與優(yōu)化,進一步提升了FP8訓(xùn)練在主流大模型上的穩(wěn)定性與可收斂性,能夠為包括DeepSeek-V3在內(nèi)的大模型訓(xùn)練提供有效支撐。

從訓(xùn)練穩(wěn)定性、收斂精度到下游任務(wù)效果,摩爾線程基于 MTT S5000 交出的這份成績單表明,在統(tǒng)一技術(shù)棧下,國產(chǎn)全功能GPU不僅驗證了大模型端到端訓(xùn)練的可用性,也展現(xiàn)出在實際訓(xùn)練效果上持續(xù)提升的潛力。

北京智源人工智能研究院副院長兼總工程師林詠華表示:“長期以來,‘對齊CUDA’只是行業(yè)在缺乏替代方案下‘不得已為之’的對齊標(biāo)準(zhǔn)。但如果能獲得比CUDA更優(yōu)的實際訓(xùn)練效果,才是產(chǎn)業(yè)界共同的期待,才能讓系統(tǒng)架構(gòu)百花齊放、勇于創(chuàng)新。摩爾線程在訓(xùn)練實測中超過了國際主流產(chǎn)品的表現(xiàn),證明了這種期待已經(jīng)有實現(xiàn)的可能性了?!?/p>

未來,摩爾線程將繼續(xù)深化與智源研究院及生態(tài)伙伴的合作,以自主創(chuàng)新的全功能GPU算力底座,推動多元算力從“普適”走向“普惠”,為中國大模型研發(fā)提供開放、高效、可規(guī)?;瘡?fù)制的“國產(chǎn)算力訓(xùn)練范式”。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
澤連斯基的眼淚

澤連斯基的眼淚

近距離
2026-06-18 17:12:18
離譜!大量音樂節(jié)宣布取消!

離譜!大量音樂節(jié)宣布取消!

嘻笑堂
2026-06-18 00:31:41
四川:明確重點打擊惡意退保等違法業(yè)態(tài)

四川:明確重點打擊惡意退保等違法業(yè)態(tài)

北京商報
2026-06-18 18:14:03
山姆高層大逃亡,真相觸目驚心

山姆高層大逃亡,真相觸目驚心

新浪財經(jīng)
2026-06-18 19:02:44
河南26歲帥哥時穎去世,結(jié)婚僅半年,妻子顏值高,悲痛透露原因

河南26歲帥哥時穎去世,結(jié)婚僅半年,妻子顏值高,悲痛透露原因

180視角
2026-06-19 12:33:45
柬埔寨電詐最大黑手竟然是副總理?

柬埔寨電詐最大黑手竟然是副總理?

鳳眼論
2026-06-18 18:45:10
演員李現(xiàn)擔(dān)任2026世界杯小組賽西班牙vs沙特一戰(zhàn)的開球嘉賓

演員李現(xiàn)擔(dān)任2026世界杯小組賽西班牙vs沙特一戰(zhàn)的開球嘉賓

大象新聞
2026-06-19 16:45:06
印度網(wǎng)友說中國也有種姓制度,仔細一看,真的讓人笑掉大牙!

印度網(wǎng)友說中國也有種姓制度,仔細一看,真的讓人笑掉大牙!

全城探秘
2026-06-18 18:06:57
匪夷所思!“濮陽護士長”悄悄上熱搜,“19分28秒”等標(biāo)簽滿天飛

匪夷所思!“濮陽護士長”悄悄上熱搜,“19分28秒”等標(biāo)簽滿天飛

火山詩話
2026-06-18 17:00:53
中國移動董事、黨組副書記王利民履新司法部黨組成員、政治部主任

中國移動董事、黨組副書記王利民履新司法部黨組成員、政治部主任

大風(fēng)新聞
2026-06-19 11:31:21
耿同學(xué)反殺母校副院長!女導(dǎo)師的男領(lǐng)導(dǎo),與1.2億估值

耿同學(xué)反殺母校副院長!女導(dǎo)師的男領(lǐng)導(dǎo),與1.2億估值

大江看潮
2026-06-19 10:23:04
大媽順走奔馳螺絲后續(xù)!長相曝光,被老板找到后說:以為你不要了

大媽順走奔馳螺絲后續(xù)!長相曝光,被老板找到后說:以為你不要了

寒士之言本尊
2026-06-18 17:37:03
警惕!A股徹底變天!國家戰(zhàn)略大洗牌,未來主線徹底明朗

警惕!A股徹底變天!國家戰(zhàn)略大洗牌,未來主線徹底明朗

新浪財經(jīng)
2026-06-19 11:12:55
謝鋒:臺灣問題、民主人權(quán)、道路制度、發(fā)展權(quán)利是中方四條紅線,不容挑戰(zhàn)

謝鋒:臺灣問題、民主人權(quán)、道路制度、發(fā)展權(quán)利是中方四條紅線,不容挑戰(zhàn)

澎湃新聞
2026-06-19 14:07:18
保安驅(qū)趕避雨寶媽后續(xù):老顧客表示不會再去店里吃,寶爸發(fā)聲回應(yīng)

保安驅(qū)趕避雨寶媽后續(xù):老顧客表示不會再去店里吃,寶爸發(fā)聲回應(yīng)

社會日日鮮
2026-06-19 09:39:10
中國造紙學(xué)會就“紙尿褲事件”聲明:市面在售產(chǎn)品安全可控

中國造紙學(xué)會就“紙尿褲事件”聲明:市面在售產(chǎn)品安全可控

新京報
2026-06-19 18:43:19
腿被踢斷,告別世界杯!24歲新星最新傷情,主帥表態(tài),肇事者發(fā)聲

腿被踢斷,告別世界杯!24歲新星最新傷情,主帥表態(tài),肇事者發(fā)聲

萌蘭聊個球
2026-06-19 10:56:25
瑞士證實:原定19日舉行的美伊?xí)劇包S了”!美股三大期指齊跌,金價跳水,油價回升!萬斯、伊朗代表團、巴基斯坦總理均已取消相關(guān)行程

瑞士證實:原定19日舉行的美伊?xí)劇包S了”!美股三大期指齊跌,金價跳水,油價回升!萬斯、伊朗代表團、巴基斯坦總理均已取消相關(guān)行程

每日經(jīng)濟新聞
2026-06-19 13:11:18
英偉達掀起GPU取代5G基站芯片革命:超130家企業(yè)站隊支持

英偉達掀起GPU取代5G基站芯片革命:超130家企業(yè)站隊支持

快科技
2026-06-18 14:33:09
FIFA:因科內(nèi)重傷世界杯報銷,薩索洛可獲最高750萬歐元補償

FIFA:因科內(nèi)重傷世界杯報銷,薩索洛可獲最高750萬歐元補償

懂球帝
2026-06-19 11:03:12
2026-06-19 19:08:50
愛集微 incentive-icons
愛集微
集微網(wǎng)官方賬號
109771文章數(shù) 98361關(guān)注度
往期回顧 全部

科技要聞

Anthropic被禁,智譜卻漲瘋了

頭條要聞

世界杯"大冷門":史上最小參賽國逼平最大奪冠熱門國

頭條要聞

世界杯"大冷門":史上最小參賽國逼平最大奪冠熱門國

體育要聞

世界杯最不知名球員,沒上場先漲粉600萬

娛樂要聞

吳倩自曝小時被爸爸打掉牙齒硬吞進肚

財經(jīng)要聞

Token低價陷阱

汽車要聞

驚出冷汗!重慶實測奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

手機
旅游
本地
教育
時尚

手機要聞

618大匯總:蘋果成最大贏家,國產(chǎn)誰笑到了最后?

旅游要聞

四川七曲山景區(qū)被指圈國道違規(guī)收費,官方通報

本地新聞

世界杯黑馬佛得角:河北人開超市,溫州人當(dāng)老板

教育要聞

低分報上好學(xué)校?高考志愿撿漏大法!

夏天上衣穿短不穿長,看看下面這幾款短上衣,顯高舒適顯比例

無障礙瀏覽 進入關(guān)懷版