免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

為啥這種人眼輕松看出的圖案,AI打死都認(rèn)不出來?

0
分享至


來源 | 數(shù)字生命卡茲克(ID:Rockhazix)

這兩天在網(wǎng)上刷到了一張圖,很有意思。


其實(shí)就是一張經(jīng)典的視覺錯(cuò)覺圖,做了個(gè)漂浮的心形圖案。

如果你用電腦打開這篇文章的話,沒看到這個(gè)圖動(dòng)起來的話,那就用手機(jī)打開或者直接把頁面縮小。

瞬間,你就能看到這個(gè)圖里的愛心,直接左右橫跳起來了。。。

看到的兄弟可以把公屏打在彈幕上。

這哥們說,這是最好的AI探測器,說,沒有AI能看到這個(gè)圖中間還有個(gè)愛心。

我順手找了幾個(gè)模型試試,結(jié)果無一例外,果然,沒一個(gè)AI認(rèn)出來。

比如Gemini 2.5 Pro,率先翻車。


給我扯了一堆有的沒的,然后說了一句,圓圈。

圈你妹= =

GPT-5-Thinking,想了2分多分鐘,直接陣亡。


甚至,我還試了一下豪華版GPT-5 Pro。

在長達(dá)7分鐘的花里胡哨之后,宣布直接躺平。


國產(chǎn)三巨頭,豆包、Qwen、元寶,也都倒在了這張圖的淫威之下。


DeepSeek因?yàn)闆]有多模態(tài),所以反而逃過一劫。

在這測試過程中,我一度產(chǎn)生了一種錯(cuò)覺,就是,不會(huì)這些模型,不知道啥叫心形吧。

導(dǎo)致我非常智障的還去問了一下。。。


認(rèn)識,看來沒啥問題。。。

你們也能看到,我用的都是同一套提示詞。

我覺得,同樣的問題交給隨便的一個(gè)人,應(yīng)該都是能得出正確答案的。

所以,我就產(chǎn)生了很強(qiáng)的好奇。

這到底是什么?

再抽空花了一晚上的時(shí)間,去DeepReaserch和研究之后,我看到了一篇AI這塊超級好玩的論文。

是今年5月發(fā)的,叫《Time Blindness: Why Video-Language Models Can’t See What Humans Can?》


真的,AI研究到后面,怎么發(fā)現(xiàn),研究的全是人類。。。

這個(gè)標(biāo)題翻譯過來大概就是:

為什么視覺語言模型看不到人類能看到的東西?

雖然文中的例子是視頻,跟我們上文的愛心圖有點(diǎn)不太一樣,但是底層原理,其實(shí)在我讀完以后看來,是完全一脈相通的。

這項(xiàng)研究設(shè)置了一個(gè)基準(zhǔn),叫做SpookyBench,合成了一堆由噪點(diǎn)組成的視頻,是黑白的。

隨便暫停一下,這個(gè)視頻的每一幀,看起來都像是隨機(jī)的雪花點(diǎn)或者電視噪音。

但是播放的時(shí)候,我們可以非常明確的看到一只鹿。

這個(gè)鹿我甚至都沒法截圖給大家看,只要截圖出來就必是噪點(diǎn)圖。

這玩意,跟最近X上流行的一個(gè)視覺錯(cuò)覺的寶劍視頻還挺像的。

你只要一暫停,就啥也看不到了。

還有很多類似的。


這篇論文就拿451個(gè)這樣的視頻,組成了一個(gè)基準(zhǔn),去視覺大模型進(jìn)行測試。


結(jié)果就是,非常的喜聞樂見。

人類可以毫不費(fèi)力地識別出這些視頻中的形狀、文本和圖案,準(zhǔn)確率超過98%。

而大模型的準(zhǔn)確率,為0%。

全軍覆沒,無一幸免。


我已經(jīng)很久很久沒見過這么多的0分了。

太特么赤雞了。

無論模型架構(gòu)大小、訓(xùn)練數(shù)據(jù)規(guī)模、是否經(jīng)過微調(diào)或采用何種提示策略,AI從未答對任何一段視頻的內(nèi)容。

我也拿幾個(gè)模型去試了一下,同樣的那頭鹿的視頻,Gemini2.5-Pro同樣無法識別。


原因其實(shí)特別簡單。

AI是空間維度上的王者,但卻是時(shí)間維度上的瞎子。

我這么說可能會(huì)有點(diǎn)難以理解。

我們可以先想想,現(xiàn)在所有的大模型,包括GPT-5、Gemini 2.5 Pro,它們是怎么看視頻的。

很多人以為他們跟人一樣,就是搬個(gè)小板凳擱那坐著,目不轉(zhuǎn)睛的看完了整個(gè)視頻?

錯(cuò)了,不是這樣的。

現(xiàn)在大模型的主流做法,本質(zhì)上不是看視頻,是看照片。

它們會(huì)從視頻里,每隔一段時(shí)間抽幀,也就是截取幾張靜態(tài)的圖片。 比如,第1秒截一張,第1.5秒截一張,第2秒截一張等等等等。

然后,AI會(huì)用它那分析靜態(tài)圖片(也就是空間信息)的能力,去分析這些所有的照片。

“哦,這張照片里有噪點(diǎn)。” “哦,這張照片里還是噪點(diǎn)?!?“哦,這張照片里依然是噪點(diǎn)。”

最后,它得出結(jié)論: “這特么就是個(gè)噪點(diǎn)視頻。”

這就是最本質(zhì)的問題所有,AI徹底丟掉了所有的幀與幀之間的信息。

而那個(gè)“漂浮的心形”和“噪點(diǎn)中的鹿”,其實(shí)本質(zhì)上,它們的信息恰恰只存在于幀與幀之間。

這其實(shí),就是,時(shí)間維度。

在任何一個(gè)單獨(dú)的瞬間,心形和鹿都是不存在的,都是不可見的。

你只有把這些瞬間連續(xù)播放,讓時(shí)間流動(dòng)起來,你才能看到他們。

突然想起了以前做交互設(shè)計(jì)的時(shí)候,有一個(gè)幾乎刻在我血液里的心理學(xué),這玩意,叫格式塔心理學(xué)。

幾乎就是用戶體驗(yàn)行業(yè)的基石之一。


里面有一個(gè)非常牛逼的原則,叫“共同命運(yùn)法則”(Law of Common Fate)。

這個(gè)法則是說,我們的大腦會(huì)本能地、自動(dòng)地、不講道理地,把朝著同一方向運(yùn)動(dòng)的物體,識別為一個(gè)整體。


這玩意幾乎就是刻在我們的史前基因里面的。

比如在幾萬年前的草原上,我們的老祖宗“智人坤坤”,正蹲在草叢里。

他眼前是一片隨風(fēng)擺動(dòng)的、雜亂的灌木。

突然,在灌木叢中,有一小片葉子的擺動(dòng)方式,跟周圍所有的葉子都不一樣,它們在以一個(gè)相同的規(guī)律,朝著同一個(gè)方向(比如坤坤的方向)緩慢移動(dòng)。

坤坤的大腦,甚至不需要他思考,就會(huì)立刻拉響警報(bào): “臥槽!快跑!老虎來了?。?!有危險(xiǎn)?。 ?/p>

那些“共同運(yùn)動(dòng)”的像素點(diǎn),在坤坤的大腦里自動(dòng)組合成了老虎這個(gè)整體。

所以,你看,當(dāng)你看到那個(gè)“噪點(diǎn)鹿”的視頻時(shí),你根本不需要努力,你大腦里的共同命運(yùn)法則就自動(dòng)啟動(dòng)了。

它幫你把所有一起往上移動(dòng)的噪點(diǎn)歸為一類,識別為“鹿”,把所有一起往下移動(dòng)的噪點(diǎn)歸為另一類,識別為“背景”。

你之所以能看到鹿,不是因?yàn)槟憧匆娏寺?,而是因?yàn)槟憧匆娏诉\(yùn)動(dòng)本身。

但AI不行。它沒有我們這套“共同命運(yùn)法則”的視覺系統(tǒng)。

它的架構(gòu),論文里叫 "Spatial Bias"空間偏見,決定了它只能先去識別空間上的特征。

它看每一幀,都是一堆雜亂無章的噪點(diǎn)。

但它無法從時(shí)間的維度上,去發(fā)現(xiàn)這些噪點(diǎn)之間“共同的命運(yùn)”,所以,它看不到那只鹿。

這個(gè)問題,在論文中,被稱為。

時(shí)間盲視,Time Blindness。

目前看,好像沒有啥解決辦法,不僅僅是一個(gè)技術(shù)漏洞了,或者一個(gè)可以喂數(shù)據(jù)就能解決的小bug,論文里也試了,微調(diào)訓(xùn)練也沒用。

我們活在流中,而AI活在幀中。

這個(gè)世界對我們來說,首先是連續(xù)的、流動(dòng)的、充滿過程的。

而對AI來說,這個(gè)世界首先是離散的、靜態(tài)的、充滿物體的。

太有意思了,這是我最近,看到的最哲學(xué)最讓我喜歡的一段表述。

我們現(xiàn)在理解了噪點(diǎn),讓我們回到最開始的愛心。

這時(shí)候,我其實(shí)又產(chǎn)生了問題,不對啊,運(yùn)動(dòng)這事,是時(shí)間維度的,但是那個(gè)愛心,明明就是一張圖,根本沒有時(shí)間屬性,那這玩意,到底為啥也能讓人感覺到,動(dòng)呢???


我沒理解,于是,我又進(jìn)行了新一輪的研究。。。

結(jié)果,答案居然讓我有點(diǎn)無語。。。

答案特別簡單,就是因?yàn)椋?/p>

因?yàn)槲覀冏约簳?huì)動(dòng)。

還是,不受控制地動(dòng)。。。

在20世紀(jì)50年代,眼動(dòng)領(lǐng)域有一個(gè)實(shí)驗(yàn)證明了一個(gè)事情,就是,人眼在注視時(shí)并非完全靜止,而是不斷進(jìn)行微小的運(yùn)動(dòng)。

正是這些不自主的眼球運(yùn)動(dòng),保證了我們對靜止圖像的持續(xù)感知。

這樣的視錯(cuò)覺圖,基本上都是利用了我們這個(gè)會(huì)自己運(yùn)動(dòng)的特征,來做出動(dòng)態(tài)效果的。


為了使人類能夠看見,視網(wǎng)膜上的圖像必須持續(xù)發(fā)生一定程度的運(yùn)動(dòng)。

反過來講,如果某個(gè)視野(無論其大小、顏色或亮度)保持嚴(yán)格的靜止,那么在1~3秒內(nèi),該區(qū)域就會(huì)在視野中逐漸消失。

視覺科學(xué)里有個(gè)差不多的理論是特克斯勒消逝效應(yīng),說的是當(dāng)人們長時(shí)間注視一個(gè)固定點(diǎn)時(shí),周邊視野中不變的刺激會(huì)逐漸淡化甚至消失。

聽起來挺繞的,但如果你想試一下,刻意控制眼球靜止不動(dòng)的話,你可以放大這張圖,然后刻意的牢牢盯住中間的十字。

應(yīng)該可以感覺到十字周圍的顏色在慢慢消失,然后變成一片灰白色。


這就是著名的特克斯勒消逝效應(yīng)的哲學(xué)。

沒有變化,則等于沒有信息。

這篇文章寫著寫著,突然感覺回到了7、8年前還在做用戶體驗(yàn)設(shè)計(jì)的時(shí)候,天天研究認(rèn)知心理學(xué)的日子。

那時(shí)候,我們天天在研究人,研究認(rèn)知心理學(xué),研究人的行為、研究人的眼動(dòng)路線、研究人的注意力、研究人的記憶,就想著,我們的產(chǎn)品,怎么讓用戶體驗(yàn)更絲滑一點(diǎn),讓他更爽一點(diǎn),我們的轉(zhuǎn)化率更高一點(diǎn)。。。

沒想到這么多年以后,天天研究AI,發(fā)現(xiàn)到頭來。

又回到了當(dāng)年。

原來當(dāng)年研究了那么久的知識,在如今的時(shí)代,又以另一種路徑,穿越了時(shí)空,散發(fā)出了新的光彩。

AI跟人,也真的都是超級有趣的物種。

在無數(shù)路徑上殊途同歸,卻又在各自的路線上,分道揚(yáng)鑣。

但我還是更喜歡人一點(diǎn)。

畢竟,我們不僅能看到噪點(diǎn)中的鹿,我們還能看到沉默中的愛,看到無常中的美。

還有,那時(shí)間。

流逝的本身。

>/ 作者:卡茲克

>/ 投稿或爆料,請聯(lián)系郵箱:[email protected]

來源 | 數(shù)字生命卡茲克(ID:Rockhazix)

未經(jīng)授權(quán),禁止二次轉(zhuǎn)載,如有需要聯(lián)系原公眾號

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
中國撤走黃巖島浮動(dòng)平臺!菲律賓還沒來及笑,新警告就到了?

中國撤走黃巖島浮動(dòng)平臺!菲律賓還沒來及笑,新警告就到了?

李云飛Afey
2026-06-19 20:46:37
“他想讓我活下去”男子點(diǎn)12.8元外賣,備注“1天指望1頓飯”求多給點(diǎn)飯,老板邀其來當(dāng)學(xué)徒,當(dāng)事人:考慮去店里做學(xué)徒

“他想讓我活下去”男子點(diǎn)12.8元外賣,備注“1天指望1頓飯”求多給點(diǎn)飯,老板邀其來當(dāng)學(xué)徒,當(dāng)事人:考慮去店里做學(xué)徒

大象新聞
2026-06-18 22:49:17
中國停發(fā)印度簽證?真相究竟是怎樣的?

中國停發(fā)印度簽證?真相究竟是怎樣的?

輝哥說動(dòng)漫
2026-06-19 09:35:44
2-1,國安險(xiǎn)勝中甲領(lǐng)頭羊,林良銘梅開二度后失點(diǎn) 張稀哲腳法頂級

2-1,國安險(xiǎn)勝中甲領(lǐng)頭羊,林良銘梅開二度后失點(diǎn) 張稀哲腳法頂級

替補(bǔ)席看球
2026-06-19 21:26:26
王守業(yè)貪污1.6億,2005年“雙規(guī)”后卻被放出,他叫囂:我擺平了

王守業(yè)貪污1.6億,2005年“雙規(guī)”后卻被放出,他叫囂:我擺平了

帝哥說史
2026-06-02 21:40:03
因涉賭缺席一季!活塞與比斯利商討1年短約回歸 仍存被罰風(fēng)險(xiǎn)

因涉賭缺席一季!活塞與比斯利商討1年短約回歸 仍存被罰風(fēng)險(xiǎn)

醉臥浮生
2026-06-19 09:47:47
特朗普夸莫迪:長得太好看了像天使,但實(shí)際上,他像一個(gè)殺手

特朗普夸莫迪:長得太好看了像天使,但實(shí)際上,他像一個(gè)殺手

每日經(jīng)濟(jì)新聞
2026-06-19 05:03:58
周星馳御用婆婆被曝晚年凄慘,被騙積蓄房產(chǎn)住養(yǎng)老院,一生未婚育

周星馳御用婆婆被曝晚年凄慘,被騙積蓄房產(chǎn)住養(yǎng)老院,一生未婚育

知法而形
2026-06-18 14:29:20
“男版泡泡瑪特”標(biāo)價(jià) 1 萬元,上架即售罄,有商家年入數(shù)千萬

“男版泡泡瑪特”標(biāo)價(jià) 1 萬元,上架即售罄,有商家年入數(shù)千萬

野生運(yùn)營
2026-06-18 01:32:14
偉人點(diǎn)評周恩來:致命弱點(diǎn)成就新中國偉業(yè)

偉人點(diǎn)評周恩來:致命弱點(diǎn)成就新中國偉業(yè)

阿物評論哥
2026-06-17 17:06:06
特朗普果然精明:G7峰會(huì)后,他送中日各一句話,高市哭的時(shí)候到了

特朗普果然精明:G7峰會(huì)后,他送中日各一句話,高市哭的時(shí)候到了

愛意隨風(fēng)起呀
2026-06-18 13:27:42
社保大局已定?今明兩年,靈活就業(yè)或斷繳過社保的人,認(rèn)準(zhǔn)3不做

社保大局已定?今明兩年,靈活就業(yè)或斷繳過社保的人,認(rèn)準(zhǔn)3不做

臨云史策
2026-06-19 14:45:36
銷量跌破萬臺 小米YU7腰斬 55萬輛目標(biāo)難達(dá)成

銷量跌破萬臺 小米YU7腰斬 55萬輛目標(biāo)難達(dá)成

中車網(wǎng)評
2026-06-17 17:45:25
中央領(lǐng)導(dǎo)到深圳這里調(diào)研,下周將有大事發(fā)生!

中央領(lǐng)導(dǎo)到深圳這里調(diào)研,下周將有大事發(fā)生!

新浪財(cái)經(jīng)
2026-06-19 00:21:43
最喜歡我公公的做法了,退休金每個(gè)月6800,最主要的還是五個(gè)特點(diǎn)

最喜歡我公公的做法了,退休金每個(gè)月6800,最主要的還是五個(gè)特點(diǎn)

荷蘭豆愛健康
2026-06-19 15:11:57
徹查!信號強(qiáng)烈!中央升級反腐“天網(wǎng)”!

徹查!信號強(qiáng)烈!中央升級反腐“天網(wǎng)”!

細(xì)說職場
2026-06-18 10:24:22
“下跪,叫爸爸”霸凌案后續(xù):打人高中生母親系治安崗公職人員

“下跪,叫爸爸”霸凌案后續(xù):打人高中生母親系治安崗公職人員

老貓觀點(diǎn)
2026-06-19 08:23:39
什么東西讓你體會(huì)到貴有貴的道理?網(wǎng)友:買前牙咬碎 買后它真值

什么東西讓你體會(huì)到貴有貴的道理?網(wǎng)友:買前牙咬碎 買后它真值

夜深愛雜談
2026-06-17 21:35:31
CBA奪冠,古德溫拒絕巴薩150萬合同,洛夫頓續(xù)約,全力爭取張鎮(zhèn)麟

CBA奪冠,古德溫拒絕巴薩150萬合同,洛夫頓續(xù)約,全力爭取張鎮(zhèn)麟

體壇侃排球
2026-06-19 21:28:44
“沒腦子,但有錢!”男子上岸川大被噴:這專業(yè)正常人都不能選!

“沒腦子,但有錢!”男子上岸川大被噴:這專業(yè)正常人都不能選!

林林先生
2026-06-19 12:30:07
2026-06-19 23:03:00
奔波兒灞與灞波兒奔 incentive-icons
奔波兒灞與灞波兒奔
機(jī)智呆逼兩基友爆笑噴飯兩冤家
5117文章數(shù) 2377601關(guān)注度
往期回顧 全部

科技要聞

Anthropic被禁,智譜卻漲瘋了

頭條要聞

公安局花148萬采購移動(dòng)警務(wù)通 中標(biāo)公告顯示數(shù)量為"1"

頭條要聞

公安局花148萬采購移動(dòng)警務(wù)通 中標(biāo)公告顯示數(shù)量為"1"

體育要聞

世界杯最不知名球員,沒上場先漲粉600萬

娛樂要聞

孫藝珍曬母子合照!4歲小甜豆暴風(fēng)成長

財(cái)經(jīng)要聞

Token低價(jià)陷阱

汽車要聞

驚出冷汗!重慶實(shí)測奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

旅游
教育
時(shí)尚
房產(chǎn)
親子

旅游要聞

端午“趣”新安,“粽”享歡樂時(shí)光!

教育要聞

頹廢不上進(jìn),孩子擺爛不是父母的錯(cuò)!

夏天上衣穿短不穿長,看看下面這幾款短上衣,顯高舒適顯比例

房產(chǎn)要聞

商業(yè)清零式退潮,大量住宅登場!三亞又要大規(guī)模調(diào)規(guī)!

親子要聞

小寶你到底喝沒喝孟婆湯?。?/h3>

無障礙瀏覽 進(jìn)入關(guān)懷版