免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

大模型“推理”是推理嗎 | 社會科學報

0
分享至



大語言模型已深度嵌入知識生產與日常交流,語言表達精湛,卻常在基礎數(shù)理與邏輯推演中出現(xiàn)偏差。實際上,大模型推理是統(tǒng)計驅動的模式匹配,與人類自上而下的規(guī)則化推理存在根本差異。唯有正視推理的多元形態(tài),方能探尋人機優(yōu)勢互補、共思共生的智能新范式。

原文 :《大模型“推理”是推理嗎》

作者 |中國科學院大學人文學院教授 張立英

圖片 |網(wǎng)絡

近年來,以大語言模型為代表的人工智能技術飛速發(fā)展,ChatGPT、DeepSeek、Claude等模型已深度嵌入人類的知識生產與日常交流之中。然而,這些模型一方面能寫出流暢的文章、回答復雜的問題,另一方面卻頻頻在簡單的數(shù)學推理、符號計數(shù)、邏輯判斷上“翻車”。這種“聰明又愚鈍”的雙面性,迫使我們從邏輯學的角度重新審視一個根本問題:大模型的“推理”究竟是不是推理?如果是,它與人類推理有何本質不同?我們又該如何提升其推理能力?


1

大模型“推理”:表象之下的模式匹配

要理解大模型的推理表現(xiàn),首先要看清其本質。大模型技術主要由預訓練、監(jiān)督細調和強化學習三個板塊組成。其中,預訓練作為大模型的主體和特色所在,其核心機制是語元(token)關聯(lián)度預測模型:通過海量文本訓練,學習不同語元(字、詞、標點等)之間在語境中共同出現(xiàn)的概率。當我們向大模型提問時,它并不是在“思考”或“推導”,而是在逐字預測“最(較)可能出現(xiàn)”的下一個語元。

這種機制決定了大模型的回答本質上是模式匹配,而非邏輯推導。它并不理解問題背后的數(shù)學概念、邏輯結構或語義關系,而是依賴訓練數(shù)據(jù)中語元之間的統(tǒng)計規(guī)律。因此,當問題形式與訓練數(shù)據(jù)中的樣本高度相似時,它表現(xiàn)出色;一旦問題稍作修改,比如更換數(shù)字、添加無關信息,模型性能就可能斷崖式下降。例如,在蘋果公司發(fā)布的GSM-Symbolic測試中,僅僅改變題目中的數(shù)字,就導致大模型在數(shù)學推理任務中的準確率下降高達65%。這說明,大模型并未掌握數(shù)學運算背后的抽象規(guī)則,而是依賴對訓練數(shù)據(jù)的表面記憶。


2

人類推理:自上而下的規(guī)則體系

與“自下而上”的大模型形成鮮明對比的是,人類的推理是“自上而下”的。我們不僅依賴具體的經驗事實,更依賴抽象的邏輯規(guī)則、語義理解、缺省預設和自我評價機制。

人類在進行推理時,能夠從具體實例中抽象出一般性規(guī)則(如傳遞性、交換律、結合律、分配律等),并通過替換機制將這些規(guī)則應用于新情境。我們還能識別和調用隱含的背景知識,比如“愛麗絲是女孩,因此她的姐妹不包括她自己”。更重要的是,人類具備對推理結果的自我檢驗能力:我們知道自己是否滿足前提條件,能否得出必然結論,甚至承認“推不出”。這套復雜的內在工作機制,使得人類推理具有高度的靈活性、共識性和解釋性。而大模型恰恰缺乏這些能力:它暫時沒有抽象—替換機制,不預設共識,也沒有自我評價機制。

3

大模型“推理”算不算推理?

如果我們嚴格按照傳統(tǒng)邏輯學對“推理”的定義——從若干前提出發(fā),依據(jù)一定規(guī)則得出結論的思維過程,那么大模型的行為似乎并不符合。它不依賴邏輯規(guī)則,不進行抽象,不涉及語義理解。然而,如果我們將“推理”理解為一種從輸入到輸出的信息轉換過程,那么大模型的運作確實可被看作一種新型推理。它的“規(guī)則”不是經典邏輯的公理,而是語元關聯(lián)度的統(tǒng)計規(guī)律;它的“前提”不是命題,而是海量的語料和上下文中的語元序列;它的“結論”則是通過概率最大化生成的語元串。

這種推理機制不同于人類,但它并非沒有邏輯結構。中國科學技術大學陳小平教授提出的形式公理系統(tǒng)Lc,就精確刻畫了大模型關聯(lián)度預測的底層邏輯。Lc僅含一條推理規(guī)則(綜合單調性),卻擁有海量推理前提(語元關聯(lián)度)。其關鍵特征包括:所有關聯(lián)度取值在[0,1]區(qū)間;預測遵循比較原則;推理具有實例性和語境相關性,但不遵循傳統(tǒng)的一般傳遞性。這一公理化工作表明,大模型推理雖然不同于經典邏輯系統(tǒng),卻具有自身統(tǒng)一的形式結構。


4

人類與大模型對立還是互補?

將人類推理與大模型推理并置比較,我們不難發(fā)現(xiàn),兩者各有所長,也各有所短。人類推理的特點在于擅長抽象、規(guī)則應用、語義理解、缺省推理和自我評價,但受限于計算能力、記憶容量和信息處理速度。而大模型推理的特點則在于擅長海量信息的統(tǒng)計關聯(lián)、快速生成語言流暢的輸出,但缺乏抽象能力、規(guī)則意識、共識預設和可靠性判斷。

這種對比讓人聯(lián)想到人工智能史上的符號主義與聯(lián)結主義之爭。符號主義強調規(guī)則與形式邏輯,試圖自上而下地構建智能;聯(lián)結主義則依賴數(shù)據(jù)和統(tǒng)計,自下而上地涌現(xiàn)智能。長期以來,這兩大范式被視為對立,但它們并非不可調和。一方面,以往人工智能的符號主義進路所使用的主要是演繹邏輯(如謂詞邏輯)的規(guī)律,但人類推理中還包含了歸納、類比等非演繹推理。這意味著,也許不是符號主義的路徑本身有問題,而是目前符號主義所使用的邏輯基底不夠合適或不夠充分。另一方面,以數(shù)據(jù)分析和統(tǒng)計方法為主導的聯(lián)結主義,其原理雖仍有一定灰箱性,但這種方法的確在很多時候“行之有效”,具有一定參考作用。這兩個進路,一個從內而外,一個從外而內,從不同角度出發(fā),實際上是在共同推進對智能深層機制的探索。

在此基礎上,也許我們應進一步思考如何找到兩種方式的共同基底要素。人類推理中大量使用類比、歸納等非演繹推理,這些推理本身就包含了分類與比較等要素。而大模型的語元關聯(lián)度預測,本質上也是在不斷進行比較(比較不同語元的共現(xiàn)概率),而如何分類也正是當下人工智能領域專家攻堅的方向之一。這表明,分類和比較也許正是人類推理與大模型推理的共同底層機制。


5

大模型推理增強的可能路徑

基于上述比較,我們可以提出三條增強大模型推理能力的路徑。

一是還原分類認知架構。人類推理中的類比、舉例、比喻等非演繹推理,都可以還原為“分類”與“比較”兩個基本要素。大模型如果能在底層引入分類架構,則可能更好地促進應用海量數(shù)據(jù)資源,而不必依賴人類的語義體系,就可能更好地模擬這些推理形式。分類并不一定依賴科學概念,而是可以基于語元之間的統(tǒng)計聚類,在保持非概念化優(yōu)勢的同時,增強推理的結構性。

二是考慮引入自然邏輯的規(guī)則。自然邏輯是一種基于自然語言表層語法的推理系統(tǒng),它不需要將語言翻譯為謂詞邏輯,而是直接在自然語言形式上運行單調性、保守性、對稱性等推理規(guī)則。這種邏輯更貼合大模型的語言處理方式,有可能在不破壞其語元關聯(lián)機制的前提下增強其推理能力。

三是增加外部評價機制。大模型缺乏自我評價能力,這是其“胡言亂語”的根源之一。我們可以在模型之外增加一套推理結果的評價標準,用于檢驗輸出是否滿足給定的邏輯約束。這套評價機制不必內嵌于模型,而是作為外部模塊運行,類似于人類對推理結果進行“元邏輯”審視。


6

對人類推理的再思考

大模型的興起,不僅挑戰(zhàn)了我們對“什么是智能”的理解,也促使我們重新審視人類推理的獨特性與局限性。人類推理并非完美無缺。我們在面對復雜統(tǒng)計信息時,容易受到認知偏誤的影響;我們在進行抽象推理時,也常常依賴教育和社會共識的支撐。大模型的出現(xiàn)恰恰提示我們,人類推理中那些被視為“自然”的能力,至少有一部分是在長期文化、教育和實踐中逐步建構出來的。因此,提升人類推理能力,同樣是一個值得關注的議題。在大模型可以快速生成語言、模擬對話的時代,人類更需要掌握的是邏輯抽象能力、批判性思維、信息篩選與驗證能力,以及對推理過程本身的元認知控制。

大語言模型的“推理”不同于人類,但它并非沒有規(guī)律。它代表了一種自下而上的、基于統(tǒng)計關聯(lián)的新型推理機制。與其簡單否定它“不會推理”,不如認真思考:我們能否在人類推理與大模型推理之間搭建一座理解與互補的橋梁?這不僅是技術問題,更是邏輯學、認知科學與人工智能交叉的前沿課題。在未來的智能社會中,人類與機器的“共思”與“共生”或許正取決于我們能否真正理解:推理,不止一種方式。

文章為社會科學報“思想工坊”融媒體原創(chuàng)出品,原載于社會科學報第2004期第5版,未經允許禁止轉載,文中內容僅代表作者觀點,不代表本報立場。

本期責編:程鑫云


《社會科學報》2026年征訂

點擊下方圖片網(wǎng)上訂報↓↓↓



特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
社保大局已定?今明兩年,靈活就業(yè)或斷繳過社保的人,認準3不做

社保大局已定?今明兩年,靈活就業(yè)或斷繳過社保的人,認準3不做

臨云史策
2026-06-19 14:45:36
才知道!菜市場和超市的豬肉差這么多,看完再也不用糾結去哪買了

才知道!菜市場和超市的豬肉差這么多,看完再也不用糾結去哪買了

阿萊美食匯
2026-06-18 16:59:08
五一回婆家給了婆婆1500,走時她給我女兒個紅包,半路拆開后哭了

五一回婆家給了婆婆1500,走時她給我女兒個紅包,半路拆開后哭了

大熊歡樂坊
2026-06-20 03:14:58
“電網(wǎng)憑啥不要我兒子?”母親淚訴:華北電力坑人!630分白考了

“電網(wǎng)憑啥不要我兒子?”母親淚訴:華北電力坑人!630分白考了

復轉這些年
2026-06-19 19:03:30
騎士奪冠整整10周年!ESPN曬15人去向:他們都沒離開籃球

騎士奪冠整整10周年!ESPN曬15人去向:他們都沒離開籃球

羅說NBA
2026-06-20 06:49:36
53歲王姐豐滿漂亮,相親當天同居,第二天起床后:我還是太年輕

53歲王姐豐滿漂亮,相親當天同居,第二天起床后:我還是太年輕

大熊歡樂坊
2026-06-20 06:23:24
為什么女性會有比男性更高的性快感?

為什么女性會有比男性更高的性快感?

宇宙時空
2026-06-04 18:20:08
2場0分鐘!韓國最貴歸化遭棄用,洪明甫為何死也不上卡斯特羅普

2場0分鐘!韓國最貴歸化遭棄用,洪明甫為何死也不上卡斯特羅普

劉哥談體育
2026-06-20 01:37:25
美國為何禁止種植竹子?終于清楚,原來竹子比我們想象的更可怕

美國為何禁止種植竹子?終于清楚,原來竹子比我們想象的更可怕

白日追夢人
2026-06-19 22:11:20
同學聚會,發(fā)現(xiàn)一個扎心的現(xiàn)實:年過40的女同學中,1/3沒有工作,1/3做著低薪但沒前途工作,剩下的1/3基本都在體制內

同學聚會,發(fā)現(xiàn)一個扎心的現(xiàn)實:年過40的女同學中,1/3沒有工作,1/3做著低薪但沒前途工作,剩下的1/3基本都在體制內

品讀時刻
2026-06-13 09:03:28
北大等名校赴泰招生,現(xiàn)場人滿為患,有大額補貼,評論區(qū)一片不滿

北大等名校赴泰招生,現(xiàn)場人滿為患,有大額補貼,評論區(qū)一片不滿

譚談社會
2026-06-18 20:04:33
發(fā)現(xiàn)朋友的孩子是唐氏兒,我該開口嗎?網(wǎng)友的回答吸引上萬共鳴!

發(fā)現(xiàn)朋友的孩子是唐氏兒,我該開口嗎?網(wǎng)友的回答吸引上萬共鳴!

夜深愛雜談
2026-06-19 21:54:50
日本球迷表態(tài),如果我們能世界杯奪冠,邀請 1 位中國人一起領獎

日本球迷表態(tài),如果我們能世界杯奪冠,邀請 1 位中國人一起領獎

酷侃體壇
2026-06-19 15:56:52
葡萄牙內訌!新星打臉 C 羅:只是普通球員!球迷暴怒沖爛全隊

葡萄牙內訌!新星打臉 C 羅:只是普通球員!球迷暴怒沖爛全隊

奶蓋熊本熊
2026-06-20 03:37:51
多家波蘭媒體:萊萬已決定轉會芝加哥火焰,下周一正式亮相

多家波蘭媒體:萊萬已決定轉會芝加哥火焰,下周一正式亮相

懂球帝
2026-06-19 18:21:21
酒商稱159瓶茅臺被扣后缺失 警方通報來了!

酒商稱159瓶茅臺被扣后缺失 警方通報來了!

看看新聞Knews
2026-06-19 01:16:02
孫藝珍難得曬母子合照!4歲小甜豆暴風成長,遺傳父母大長腿

孫藝珍難得曬母子合照!4歲小甜豆暴風成長,遺傳父母大長腿

達達哥
2026-06-19 19:00:57
最新結果!13票贊成0票反對,菲律賓政壇“變天”?菲或向俄求助

最新結果!13票贊成0票反對,菲律賓政壇“變天”?菲或向俄求助

策前論
2026-06-18 19:18:19
i7的“后媽裙”翻車了?這波ootd讓人看不懂

i7的“后媽裙”翻車了?這波ootd讓人看不懂

娛圈觀察員
2026-06-20 00:08:44
電動車或將要被取代?多地開始大批投放!新型代步車已經正式登場

電動車或將要被取代?多地開始大批投放!新型代步車已經正式登場

離離言幾許
2026-06-20 01:16:13
2026-06-20 07:07:00
社會科學報 incentive-icons
社會科學報
社會科學院主辦社會科學報
4261文章數(shù) 23462關注度
往期回顧 全部

科技要聞

Anthropic被禁,智譜卻漲瘋了

頭條要聞

世界杯-美國2-0澳大利亞 提前一輪小組出線

頭條要聞

世界杯-美國2-0澳大利亞 提前一輪小組出線

體育要聞

世界杯最不知名球員,沒上場先漲粉600萬

娛樂要聞

孫藝珍曬母子合照!4歲小甜豆暴風成長

財經要聞

Token低價陷阱

汽車要聞

驚出冷汗!重慶實測奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

房產
家居
游戲
數(shù)碼
教育

房產要聞

商業(yè)清零式退潮,大量住宅登場!三亞又要大規(guī)模調規(guī)!

家居要聞

綠意盎然 自然之境

任天堂完全獨占新游開預購!7月23日發(fā)售 女主好性感

數(shù)碼要聞

SSD太貴換回HDD:機械硬盤價格連漲5個季度!

教育要聞

考生家長速看!多所985、研究型高校在蓉招生咨詢安排來了

無障礙瀏覽 進入關懷版