免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

情感識(shí)別不再是分類題:EmotionThinker讓SpeechLLM 學(xué)會(huì)解釋情緒

0
分享至



語(yǔ)音情感識(shí)別(Speech Emotion Recognition, SER)在過(guò)去基本遵循同一種范式:輸入語(yǔ)音,輸出情緒標(biāo)簽。這種設(shè)定在工程上有效,但在認(rèn)知層面卻過(guò)于簡(jiǎn)化。

在人類交流中,情緒判斷從來(lái)不是一個(gè) “標(biāo)簽選擇” 的過(guò)程,而是一種基于證據(jù)整合的推理行為。我們會(huì)綜合語(yǔ)調(diào)變化、音高起伏、語(yǔ)速快慢、重音位置、語(yǔ)義內(nèi)容,以及說(shuō)話人的身份特征,去解釋 “為什么” 這是憤怒、“為什么” 這是失落。

因此,一個(gè)更根本的問(wèn)題浮現(xiàn)出來(lái):

SpeechLLM 是否具備像人類一樣解釋 “為什么” 做出情緒判斷的能力?

為此,研究團(tuán)隊(duì)提出了EmotionThinker—— 首個(gè)面向可解釋情感推理(Explainable Emotion Reasoning)的強(qiáng)化學(xué)習(xí)框架,嘗試將 SER 從 “分類任務(wù)” 提升為 “多模態(tài)證據(jù)驅(qū)動(dòng)的推理任務(wù)”。



  • 論文標(biāo)題:EmotionThinker: Prosody-Aware Reinforcement Learning for Explainable Speech Emotion Reasoning

一、從 “情緒分類” 到 “情感推理”

EmotionThinker 首先對(duì)語(yǔ)音情感識(shí)別任務(wù)本身進(jìn)行了重定義,將其擴(kuò)展為情感推理任務(wù)(Emotion Reasoning)。在新的設(shè)定下,模型不僅需要預(yù)測(cè)情緒標(biāo)簽,還需要生成一段解釋,明確指出:

  • 哪些聲學(xué)線索支持這一判斷
  • 哪些語(yǔ)義線索起到關(guān)鍵作用
  • 這些線索如何共同構(gòu)成最終結(jié)論

這種范式轉(zhuǎn)變意味著,模型輸出從 “標(biāo)簽” 升級(jí)為 “標(biāo)簽 + 基于證據(jù)的推理”。

它的意義并非簡(jiǎn)單延長(zhǎng)輸出,而是對(duì)優(yōu)化目標(biāo)的重寫(xiě)。模型不再只需 “預(yù)測(cè)正確”,而必須學(xué)習(xí)如何整合韻律、語(yǔ)義與說(shuō)話人屬性等多模態(tài)信號(hào),并在解釋中體現(xiàn)證據(jù)對(duì)齊過(guò)程。情緒識(shí)別由此從判別問(wèn)題轉(zhuǎn)變?yōu)榻Y(jié)構(gòu)化推理問(wèn)題。




二、EmotionThinker:

面向可解釋情感推理的框架

EmotionThinker 的目標(biāo)并不局限于提升最終準(zhǔn)確率,而是同時(shí)提升三方面能力:

(1)更高的情緒識(shí)別準(zhǔn)確率

(2)更強(qiáng)的情緒線索整合與推理能力

(3)更細(xì)粒度的音頻描述能力,覆蓋說(shuō)話人特征、韻律線索與語(yǔ)義信息

為了支撐這一目標(biāo),研究團(tuán)隊(duì)首先構(gòu)建了EmotionCoT-35K。這是一個(gè)包含 35,000+ 條樣本的 Chain-of-Thought 風(fēng)格數(shù)據(jù)集。與傳統(tǒng) SER 數(shù)據(jù)不同,它不僅提供情緒標(biāo)簽,還提供細(xì)粒度韻律描述與結(jié)構(gòu)化推理解釋。

這些樣本明確標(biāo)注了音高、能量、語(yǔ)速、重音、語(yǔ)調(diào)輪廓等線索如何支持情緒判斷,使模型能夠?qū)W習(xí)到 “證據(jù) — 推理 — 結(jié)論” 之間的對(duì)應(yīng)關(guān)系。

與此同時(shí),研究團(tuán)隊(duì)觀察到:若模型的韻律感知能力不足,其情感推理能力將受到系統(tǒng)性限制。因此,研究團(tuán)隊(duì)進(jìn)一步構(gòu)建了一個(gè) EmotionThinker-Base。EmotionThinker-Base 通過(guò)監(jiān)督微調(diào)增強(qiáng)模型對(duì)音高變化、能量波動(dòng)、語(yǔ)速模式與重音等結(jié)構(gòu)的感知能力,從而為后續(xù)的推理優(yōu)化提供穩(wěn)定基礎(chǔ)。



三、GRPO-PTR:

讓強(qiáng)化學(xué)習(xí)真正優(yōu)化 “解釋能力”

在將語(yǔ)音情感識(shí)別重定義為情感推理之后,一個(gè)新的優(yōu)化難題隨之出現(xiàn):如何在開(kāi)放式生成場(chǎng)景中,對(duì) “推理質(zhì)量” 進(jìn)行穩(wěn)定強(qiáng)化學(xué)習(xí)?直接將推理獎(jiǎng)勵(lì)與情緒預(yù)測(cè)獎(jiǎng)勵(lì)簡(jiǎn)單疊加,會(huì)帶來(lái)明顯的噪聲問(wèn)題。一方面,模型可能生成語(yǔ)言上看似合理但與最終情緒判斷不一致的解釋;另一方面,在訓(xùn)練初期,模型尚未形成穩(wěn)定的聲學(xué) — 語(yǔ)義對(duì)齊能力,過(guò)強(qiáng)的推理獎(jiǎng)勵(lì)容易放大早期隨機(jī)偏差,導(dǎo)致策略梯度震蕩。為此,研究團(tuán)隊(duì)提出了 GRPO-PTR(Progressive Trust-aware Reasoning)。

首先,研究團(tuán)隊(duì)采用了漸進(jìn)式推理獎(jiǎng)勵(lì)調(diào)度。在訓(xùn)練初期,優(yōu)化重點(diǎn)放在情緒預(yù)測(cè)的穩(wěn)定性上;隨著模型策略逐步收斂,逐步提高推理獎(jiǎng)勵(lì)權(quán)重,使模型從 “預(yù)測(cè)正確” 過(guò)渡到 “解釋合理”。這種 reward scheduling 降低了早期高方差信號(hào)對(duì)訓(xùn)練穩(wěn)定性的影響。

其次,研究團(tuán)隊(duì)引入基于一致性的可信度加權(quán)機(jī)制。當(dāng)模型生成的推理與最終情緒預(yù)測(cè)保持一致時(shí),推理獎(jiǎng)勵(lì)按完整權(quán)重計(jì)入;當(dāng)二者存在沖突時(shí),推理獎(jiǎng)勵(lì)自動(dòng)衰減。該機(jī)制有效緩解了開(kāi)放式生成任務(wù)中常見(jiàn)的 reward misalignment 問(wèn)題,使解釋優(yōu)化始終服務(wù)于情緒判斷本身。

從優(yōu)化角度看,GRPO-PTR 解決的是一個(gè)更一般的問(wèn)題:如何在 “預(yù)測(cè) + 解釋” 的多目標(biāo)生成任務(wù)中,使結(jié)構(gòu)化推理與最終決策保持對(duì)齊,并在強(qiáng)化學(xué)習(xí)框架下穩(wěn)定收斂。



四、實(shí)驗(yàn)結(jié)果與研究啟示

在多個(gè)標(biāo)準(zhǔn)語(yǔ)音情感識(shí)別基準(zhǔn)上,EmotionThinker 同時(shí)實(shí)現(xiàn)了:

  • 更高的情緒識(shí)別準(zhǔn)確率
  • 更優(yōu)的解釋質(zhì)量
  • 更穩(wěn)定的韻律線索整合能力

更重要的是,我們觀察到一個(gè)關(guān)鍵現(xiàn)象:當(dāng)模型被顯式訓(xùn)練去對(duì)齊聲學(xué)線索與情緒判斷時(shí),其在復(fù)雜情緒場(chǎng)景下的魯棒性顯著增強(qiáng)。這說(shuō)明,情感理解的瓶頸并不僅僅在語(yǔ)義層面,而在于聲學(xué)與語(yǔ)義信號(hào)的協(xié)同建模能力。換句話說(shuō):如果模型不能準(zhǔn)確理解 “怎么說(shuō)”,它就無(wú)法穩(wěn)定理解 “是什么情緒”。






結(jié)語(yǔ)


EmotionThinker 并不僅僅是在情感識(shí)別任務(wù)上提升準(zhǔn)確率,而是在任務(wù)定義層面完成了一次轉(zhuǎn)變。

情緒識(shí)別不應(yīng)只是標(biāo)簽預(yù)測(cè),而應(yīng)是基于多模態(tài)證據(jù)的結(jié)構(gòu)化推理過(guò)程。從 “分類” 到 “解釋”,從 “標(biāo)簽” 到 “證據(jù) — 推理 — 結(jié)論” 的一致性對(duì)齊,情感理解正在進(jìn)入一個(gè)強(qiáng)調(diào)可解釋性與結(jié)構(gòu)協(xié)同的階段。

當(dāng)模型學(xué)會(huì)解釋情緒時(shí),它不僅在給出判斷,也在展示其如何整合聲學(xué)與語(yǔ)義線索。

這或許是多模態(tài)大模型邁向真正情感理解能力的重要一步。

作者簡(jiǎn)介

本文第一作者為王丁冬,香港中文大學(xué)博士生,研究方向?yàn)檎Z(yǔ)音大模型的口語(yǔ)理解,對(duì)話與推理 (Reasoning),導(dǎo)師為 Helen Meng 教授。本文在微軟劉樹(shù)杰博士與Jinyu Li博士的共同指導(dǎo)下完成。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
橫掃法國(guó)3將回暖太關(guān)鍵!唐欣頂住接應(yīng)位置,2年輕副攻給足貢獻(xiàn)!

橫掃法國(guó)3將回暖太關(guān)鍵!唐欣頂住接應(yīng)位置,2年輕副攻給足貢獻(xiàn)!

籃球資訊達(dá)人
2026-06-20 01:00:04
“吃了3倍止痛藥”女演員硬撐上臺(tái),誤以為減重手術(shù)后遺癥,送醫(yī)后確診腸梗阻

“吃了3倍止痛藥”女演員硬撐上臺(tái),誤以為減重手術(shù)后遺癥,送醫(yī)后確診腸梗阻

大象新聞
2026-06-19 13:23:06
大齡剩女破防:被自己拒絕了3次的男生居然娶了個(gè)有錢(qián)有顏的美女

大齡剩女破防:被自己拒絕了3次的男生居然娶了個(gè)有錢(qián)有顏的美女

燈錦年
2026-06-19 12:24:33
歐盟稱已確認(rèn)中國(guó)訓(xùn)練俄軍,北京強(qiáng)硬回?fù)簦杭儗傥勖?>
    </a>
        <h3>
      <a href=桂系007
2026-06-17 00:20:57
1:2出局!足協(xié)杯焦點(diǎn)1戰(zhàn):北京國(guó)安屢失良機(jī),被中甲豪門(mén)逼入絕境

1:2出局!足協(xié)杯焦點(diǎn)1戰(zhàn):北京國(guó)安屢失良機(jī),被中甲豪門(mén)逼入絕境

話體壇
2026-06-19 22:10:39
66歲梁安琪現(xiàn)身佛山商場(chǎng),一身迪奧套裝,笑容從容走出喪夫陰霾

66歲梁安琪現(xiàn)身佛山商場(chǎng),一身迪奧套裝,笑容從容走出喪夫陰霾

鐵錘妹妹是只貓
2026-06-20 00:00:18
中國(guó)斷供,日本巨頭永久停產(chǎn)!韓國(guó)偷轉(zhuǎn)鎢粉被抓,這下全完了

中國(guó)斷供,日本巨頭永久停產(chǎn)!韓國(guó)偷轉(zhuǎn)鎢粉被抓,這下全完了

一個(gè)有靈魂的作者
2026-06-19 17:47:10
婆婆要掌管財(cái)政大權(quán)丈夫立刻交卡我停掉所有開(kāi)銷,直接出差60天

婆婆要掌管財(cái)政大權(quán)丈夫立刻交卡我停掉所有開(kāi)銷,直接出差60天

麥子情感故事
2026-06-19 23:33:44
WTT球星賽最新戰(zhàn)報(bào):國(guó)乒單打5勝17負(fù)!世界前十林詩(shī)棟、陳熠出局

WTT球星賽最新戰(zhàn)報(bào):國(guó)乒單打5勝17負(fù)!世界前十林詩(shī)棟、陳熠出局

等等talk
2026-06-20 01:40:17
蔣勤勤曬娃,兒子榮獲海淀區(qū)三好學(xué)生,被加州大學(xué)伯克利錄取罕見(jiàn)

蔣勤勤曬娃,兒子榮獲海淀區(qū)三好學(xué)生,被加州大學(xué)伯克利錄取罕見(jiàn)

娛說(shuō)瑜悅
2026-06-19 17:05:08
高潮那一刻,你腦子里到底發(fā)生了什么?

高潮那一刻,你腦子里到底發(fā)生了什么?

理性之光啊
2026-06-19 01:05:16
“初中女生壞起來(lái)比男孩更可怕”,班主任曝內(nèi)情:三觀都被刷新了

“初中女生壞起來(lái)比男孩更可怕”,班主任曝內(nèi)情:三觀都被刷新了

澤澤先生
2026-06-18 19:58:44
53歲任泉近況曝光!被曝與黃綺雯隱婚17年,身價(jià)幾十億成人生贏家

53歲任泉近況曝光!被曝與黃綺雯隱婚17年,身價(jià)幾十億成人生贏家

觀史搜尋著
2026-06-01 10:57:12
八國(guó)聯(lián)軍侵華已過(guò)百年,至今沒(méi)有一個(gè)中國(guó)人能笑著走出俄羅斯冬宮

八國(guó)聯(lián)軍侵華已過(guò)百年,至今沒(méi)有一個(gè)中國(guó)人能笑著走出俄羅斯冬宮

史之銘
2026-06-18 07:04:05
她是毛新宇前妻,服務(wù)員出身北大畢業(yè),結(jié)婚3年無(wú)子女 今定居北京

她是毛新宇前妻,服務(wù)員出身北大畢業(yè),結(jié)婚3年無(wú)子女 今定居北京

以茶帶書(shū)
2026-06-17 19:25:25
潛伏我國(guó)30年美國(guó)辣醬巨頭,年賺300億打敗老干媽,被誤認(rèn)是國(guó)貨

潛伏我國(guó)30年美國(guó)辣醬巨頭,年賺300億打敗老干媽,被誤認(rèn)是國(guó)貨

素衣讀史
2024-12-19 14:16:46
4換1?追求米切爾!馬刺操作引爆聯(lián)盟,福克斯圣城生涯提前結(jié)束了

4換1?追求米切爾!馬刺操作引爆聯(lián)盟,??怂故コ巧奶崆敖Y(jié)束了

體育大朋說(shuō)
2026-06-19 10:39:19
1976年,毛主席審閱中央政治局會(huì)議參會(huì)名單,下令:不要約蘇振華

1976年,毛主席審閱中央政治局會(huì)議參會(huì)名單,下令:不要約蘇振華

簡(jiǎn)史檔案館
2026-06-19 11:05:03
人口大遷徙已是定局?明后年,越來(lái)越多人會(huì)流入這4座城市?

人口大遷徙已是定局?明后年,越來(lái)越多人會(huì)流入這4座城市?

空谷幽幽藍(lán)
2026-05-28 20:33:01
PCB+光模塊+液冷+先進(jìn)封裝:AI算力產(chǎn)業(yè)鏈15家企業(yè),誰(shuí)值得關(guān)注?

PCB+光模塊+液冷+先進(jìn)封裝:AI算力產(chǎn)業(yè)鏈15家企業(yè),誰(shuí)值得關(guān)注?

花小貓的美食日常
2026-06-19 10:25:57
2026-06-20 04:35:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
13299文章數(shù) 142674關(guān)注度
往期回顧 全部

科技要聞

Anthropic被禁,智譜卻漲瘋了

頭條要聞

特朗普:伊朗走投無(wú)路徹底完蛋了 我們就把這60天耗完

頭條要聞

特朗普:伊朗走投無(wú)路徹底完蛋了 我們就把這60天耗完

體育要聞

世界杯最不知名球員,沒(méi)上場(chǎng)先漲粉600萬(wàn)

娛樂(lè)要聞

孫藝珍曬母子合照!4歲小甜豆暴風(fēng)成長(zhǎng)

財(cái)經(jīng)要聞

Token低價(jià)陷阱

汽車要聞

驚出冷汗!重慶實(shí)測(cè)奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

游戲
親子
家居
教育
公開(kāi)課

任天堂完全獨(dú)占新游開(kāi)預(yù)購(gòu)!7月23日發(fā)售 女主好性感

親子要聞

從毒奶粉到毒紙尿褲,兒童用品安全防線為何屢屢失守

家居要聞

綠意盎然 自然之境

教育要聞

高考送考就是全社會(huì)對(duì)孩子最大的溺愛(ài)!

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版