大模型“推理”是推理嗎 | 社會科學報

2026-06-09 12:04:35　來源: 社會科學報

上海舉報

分享至

大語言模型已深度嵌入知識生產與日常交流，語言表達精湛，卻常在基礎數(shù)理與邏輯推演中出現(xiàn)偏差。實際上，大模型推理是統(tǒng)計驅動的模式匹配，與人類自上而下的規(guī)則化推理存在根本差異。唯有正視推理的多元形態(tài)，方能探尋人機優(yōu)勢互補、共思共生的智能新范式。

原文：《大模型“推理”是推理嗎》

作者 |中國科學院大學人文學院教授張立英

圖片 |網(wǎng)絡

近年來，以大語言模型為代表的人工智能技術飛速發(fā)展，ChatGPT、DeepSeek、Claude等模型已深度嵌入人類的知識生產與日常交流之中。然而，這些模型一方面能寫出流暢的文章、回答復雜的問題，另一方面卻頻頻在簡單的數(shù)學推理、符號計數(shù)、邏輯判斷上“翻車”。這種“聰明又愚鈍”的雙面性，迫使我們從邏輯學的角度重新審視一個根本問題：大模型的“推理”究竟是不是推理？如果是，它與人類推理有何本質不同？我們又該如何提升其推理能力？

大模型“推理”：表象之下的模式匹配

要理解大模型的推理表現(xiàn)，首先要看清其本質。大模型技術主要由預訓練、監(jiān)督細調和強化學習三個板塊組成。其中，預訓練作為大模型的主體和特色所在，其核心機制是語元（token）關聯(lián)度預測模型：通過海量文本訓練，學習不同語元（字、詞、標點等）之間在語境中共同出現(xiàn)的概率。當我們向大模型提問時，它并不是在“思考”或“推導”，而是在逐字預測“最（較）可能出現(xiàn)”的下一個語元。

這種機制決定了大模型的回答本質上是模式匹配，而非邏輯推導。它并不理解問題背后的數(shù)學概念、邏輯結構或語義關系，而是依賴訓練數(shù)據(jù)中語元之間的統(tǒng)計規(guī)律。因此，當問題形式與訓練數(shù)據(jù)中的樣本高度相似時，它表現(xiàn)出色；一旦問題稍作修改，比如更換數(shù)字、添加無關信息，模型性能就可能斷崖式下降。例如，在蘋果公司發(fā)布的GSM-Symbolic測試中，僅僅改變題目中的數(shù)字，就導致大模型在數(shù)學推理任務中的準確率下降高達65%。這說明，大模型并未掌握數(shù)學運算背后的抽象規(guī)則，而是依賴對訓練數(shù)據(jù)的表面記憶。

人類推理：自上而下的規(guī)則體系

與“自下而上”的大模型形成鮮明對比的是，人類的推理是“自上而下”的。我們不僅依賴具體的經驗事實，更依賴抽象的邏輯規(guī)則、語義理解、缺省預設和自我評價機制。

人類在進行推理時，能夠從具體實例中抽象出一般性規(guī)則（如傳遞性、交換律、結合律、分配律等），并通過替換機制將這些規(guī)則應用于新情境。我們還能識別和調用隱含的背景知識，比如“愛麗絲是女孩，因此她的姐妹不包括她自己”。更重要的是，人類具備對推理結果的自我檢驗能力：我們知道自己是否滿足前提條件，能否得出必然結論，甚至承認“推不出”。這套復雜的內在工作機制，使得人類推理具有高度的靈活性、共識性和解釋性。而大模型恰恰缺乏這些能力：它暫時沒有抽象—替換機制，不預設共識，也沒有自我評價機制。

大模型“推理”算不算推理？

如果我們嚴格按照傳統(tǒng)邏輯學對“推理”的定義——從若干前提出發(fā)，依據(jù)一定規(guī)則得出結論的思維過程，那么大模型的行為似乎并不符合。它不依賴邏輯規(guī)則，不進行抽象，不涉及語義理解。然而，如果我們將“推理”理解為一種從輸入到輸出的信息轉換過程，那么大模型的運作確實可被看作一種新型推理。它的“規(guī)則”不是經典邏輯的公理，而是語元關聯(lián)度的統(tǒng)計規(guī)律；它的“前提”不是命題，而是海量的語料和上下文中的語元序列；它的“結論”則是通過概率最大化生成的語元串。

這種推理機制不同于人類，但它并非沒有邏輯結構。中國科學技術大學陳小平教授提出的形式公理系統(tǒng)Lc，就精確刻畫了大模型關聯(lián)度預測的底層邏輯。Lc僅含一條推理規(guī)則（綜合單調性），卻擁有海量推理前提（語元關聯(lián)度）。其關鍵特征包括：所有關聯(lián)度取值在[0,1]區(qū)間；預測遵循比較原則；推理具有實例性和語境相關性，但不遵循傳統(tǒng)的一般傳遞性。這一公理化工作表明，大模型推理雖然不同于經典邏輯系統(tǒng)，卻具有自身統(tǒng)一的形式結構。

人類與大模型對立還是互補？

將人類推理與大模型推理并置比較，我們不難發(fā)現(xiàn)，兩者各有所長，也各有所短。人類推理的特點在于擅長抽象、規(guī)則應用、語義理解、缺省推理和自我評價，但受限于計算能力、記憶容量和信息處理速度。而大模型推理的特點則在于擅長海量信息的統(tǒng)計關聯(lián)、快速生成語言流暢的輸出，但缺乏抽象能力、規(guī)則意識、共識預設和可靠性判斷。

這種對比讓人聯(lián)想到人工智能史上的符號主義與聯(lián)結主義之爭。符號主義強調規(guī)則與形式邏輯，試圖自上而下地構建智能；聯(lián)結主義則依賴數(shù)據(jù)和統(tǒng)計，自下而上地涌現(xiàn)智能。長期以來，這兩大范式被視為對立，但它們并非不可調和。一方面，以往人工智能的符號主義進路所使用的主要是演繹邏輯（如謂詞邏輯）的規(guī)律，但人類推理中還包含了歸納、類比等非演繹推理。這意味著，也許不是符號主義的路徑本身有問題，而是目前符號主義所使用的邏輯基底不夠合適或不夠充分。另一方面，以數(shù)據(jù)分析和統(tǒng)計方法為主導的聯(lián)結主義，其原理雖仍有一定灰箱性，但這種方法的確在很多時候“行之有效”，具有一定參考作用。這兩個進路，一個從內而外，一個從外而內，從不同角度出發(fā)，實際上是在共同推進對智能深層機制的探索。

在此基礎上，也許我們應進一步思考如何找到兩種方式的共同基底要素。人類推理中大量使用類比、歸納等非演繹推理，這些推理本身就包含了分類與比較等要素。而大模型的語元關聯(lián)度預測，本質上也是在不斷進行比較（比較不同語元的共現(xiàn)概率），而如何分類也正是當下人工智能領域專家攻堅的方向之一。這表明，分類和比較也許正是人類推理與大模型推理的共同底層機制。

大模型推理增強的可能路徑

基于上述比較，我們可以提出三條增強大模型推理能力的路徑。

一是還原分類認知架構。人類推理中的類比、舉例、比喻等非演繹推理，都可以還原為“分類”與“比較”兩個基本要素。大模型如果能在底層引入分類架構，則可能更好地促進應用海量數(shù)據(jù)資源，而不必依賴人類的語義體系，就可能更好地模擬這些推理形式。分類并不一定依賴科學概念，而是可以基于語元之間的統(tǒng)計聚類，在保持非概念化優(yōu)勢的同時，增強推理的結構性。

二是考慮引入自然邏輯的規(guī)則。自然邏輯是一種基于自然語言表層語法的推理系統(tǒng)，它不需要將語言翻譯為謂詞邏輯，而是直接在自然語言形式上運行單調性、保守性、對稱性等推理規(guī)則。這種邏輯更貼合大模型的語言處理方式，有可能在不破壞其語元關聯(lián)機制的前提下增強其推理能力。

三是增加外部評價機制。大模型缺乏自我評價能力，這是其“胡言亂語”的根源之一。我們可以在模型之外增加一套推理結果的評價標準，用于檢驗輸出是否滿足給定的邏輯約束。這套評價機制不必內嵌于模型，而是作為外部模塊運行，類似于人類對推理結果進行“元邏輯”審視。

對人類推理的再思考

大模型的興起，不僅挑戰(zhàn)了我們對“什么是智能”的理解，也促使我們重新審視人類推理的獨特性與局限性。人類推理并非完美無缺。我們在面對復雜統(tǒng)計信息時，容易受到認知偏誤的影響；我們在進行抽象推理時，也常常依賴教育和社會共識的支撐。大模型的出現(xiàn)恰恰提示我們，人類推理中那些被視為“自然”的能力，至少有一部分是在長期文化、教育和實踐中逐步建構出來的。因此，提升人類推理能力，同樣是一個值得關注的議題。在大模型可以快速生成語言、模擬對話的時代，人類更需要掌握的是邏輯抽象能力、批判性思維、信息篩選與驗證能力，以及對推理過程本身的元認知控制。

大語言模型的“推理”不同于人類，但它并非沒有規(guī)律。它代表了一種自下而上的、基于統(tǒng)計關聯(lián)的新型推理機制。與其簡單否定它“不會推理”，不如認真思考：我們能否在人類推理與大模型推理之間搭建一座理解與互補的橋梁？這不僅是技術問題，更是邏輯學、認知科學與人工智能交叉的前沿課題。在未來的智能社會中，人類與機器的“共思”與“共生”或許正取決于我們能否真正理解：推理，不止一種方式。

文章為社會科學報“思想工坊”融媒體原創(chuàng)出品，原載于社會科學報第2004期第5版，未經允許禁止轉載，文中內容僅代表作者觀點，不代表本報立場。

本期責編：程鑫云

《社會科學報》2026年征訂

點擊下方圖片網(wǎng)上訂報↓↓↓

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.