免费手机在线观看不卡A片视频_日本十八禁视频无遮挡_好吊色欧美一区二区三区四区_韩国18禁电影已婚的女人_久久久久久精品免费看_欧美在线视频免费观看_经典三级线在线观看_他添的我好湿好爽视频_日产久久视频

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

ICLR 2026 | PIL:基于線(xiàn)性代理的不可學(xué)習(xí)樣本生成方法

0
分享至



不可學(xué)習(xí)樣本(Unlearnable Examples)是一類(lèi)用于數(shù)據(jù)保護(hù)的技術(shù),其核心思想是在原始數(shù)據(jù)中注入人類(lèi)難以察覺(jué)的微小擾動(dòng),使得未經(jīng)授權(quán)的第三方在使用這些數(shù)據(jù)訓(xùn)練模型時(shí),模型的泛化性能顯著下降,甚至接近隨機(jī)猜測(cè),從而達(dá)到阻止數(shù)據(jù)被濫用的目的。

例如,對(duì)于攝影師公開(kāi)發(fā)布的作品或用戶(hù)分享的個(gè)人照片,在添加擾動(dòng)后,圖像在視覺(jué)上幾乎不發(fā)生變化;但若這些數(shù)據(jù)被用于訓(xùn)練圖像分類(lèi)模型,其測(cè)試準(zhǔn)確率可能會(huì)從 90% 降至 10% 左右。

隨著深度模型對(duì)大規(guī)模數(shù)據(jù)依賴(lài)程度的不斷提升,不可學(xué)習(xí)樣本逐漸成為數(shù)據(jù)隱私與模型安全領(lǐng)域的重要研究方向。然而,現(xiàn)有方法在實(shí)際應(yīng)用中仍面臨顯著的效率瓶頸。



  • 論文鏈接: https://arxiv.org/abs/2601.19967
  • 代碼已開(kāi)源: https://github.com/jinlinll/pil

現(xiàn)有方法的效率瓶頸

當(dāng)前主流的不可學(xué)習(xí)樣本生成方法大多依賴(lài)深度神經(jīng)網(wǎng)絡(luò)(DNN)作為代理模型。其典型流程包括:

1. 訓(xùn)練一個(gè)復(fù)雜的深度模型(如 ResNet、VGG)作為代理;

2. 在代理模型上通過(guò)對(duì)抗攻擊方法(如 PGD)迭代優(yōu)化擾動(dòng);

3. 利用擾動(dòng)在其他模型上的遷移性實(shí)現(xiàn)防護(hù)效果。

這種對(duì)深度模型的依賴(lài)帶來(lái)了若干問(wèn)題:

  • 計(jì)算開(kāi)銷(xiāo)高:生成一次擾動(dòng)往往需要大量 GPU 資源。例如,REM 方法在 CIFAR-10 數(shù)據(jù)集上的擾動(dòng)生成時(shí)間超過(guò) 15 GPU 小時(shí);
  • 擴(kuò)展性受限:當(dāng)應(yīng)用于高分辨率圖像或大規(guī)模數(shù)據(jù)集(如 ImageNet)時(shí),時(shí)間成本迅速上升;
  • 模型復(fù)雜度冗余:深模型的強(qiáng)非線(xiàn)性表達(dá)能力并非不可學(xué)習(xí)樣本生成的必要條件,反而增加了優(yōu)化難度。

核心觀察:不可學(xué)習(xí)樣本與模型線(xiàn)性化

我們關(guān)注到一個(gè)關(guān)鍵現(xiàn)象:不可學(xué)習(xí)樣本的作用機(jī)制,本質(zhì)上是誘導(dǎo)深模型退化為近似線(xiàn)性的行為模式。

我們?cè)u(píng)估了多種現(xiàn)有不可學(xué)習(xí)樣本方法(包括 EM、REM、TAP、SP、AR 等),發(fā)現(xiàn)一個(gè)一致現(xiàn)象:無(wú)論方法設(shè)計(jì)多么復(fù)雜,最終均會(huì)誘導(dǎo)深度模型呈現(xiàn)更強(qiáng)的線(xiàn)性特征(通過(guò) FGSM 的成功率度量)



表 1:不同 FGSM 攻擊步長(zhǎng)下不可學(xué)習(xí)樣本導(dǎo)致的額外準(zhǔn)確率下降百分比(擾動(dòng)比例 50%)

從這一角度出發(fā),如果最終目標(biāo)是使深模型表現(xiàn)出線(xiàn)性特性,那么使用復(fù)雜的深度模型作為代理并非必要。相反,直接利用線(xiàn)性模型生成擾動(dòng),可能更直接地作用于這一核心機(jī)制。

基于此,我們提出PIL(Perturbation-Induced Linearization): 通過(guò)線(xiàn)性模型作為代理,直接生成能夠誘導(dǎo)深模型線(xiàn)性化的不可學(xué)習(xí)擾動(dòng)。

PIL 方法概述

與基于對(duì)抗攻擊的方案不同,PIL 通過(guò)一個(gè)雙目標(biāo)優(yōu)化過(guò)程,引導(dǎo)模型學(xué)習(xí)線(xiàn)性映射。

1. 語(yǔ)義混淆(Semantic Obfuscation)

通過(guò)最小化 KL 散度,使線(xiàn)性代理模型在擾動(dòng)后的樣本上輸出接近均勻分布,從而削弱原始圖像中可用于分類(lèi)的語(yǔ)義信息。

2. 捷徑誘導(dǎo)(Shortcut Learning)

通過(guò)最小化交叉熵?fù)p失,使代理模型能夠僅依據(jù)擾動(dòng)準(zhǔn)確預(yù)測(cè)標(biāo)簽,從而將判別信息嵌入進(jìn)擾動(dòng)中。

兩個(gè)目標(biāo)通過(guò)平衡參數(shù) λ 進(jìn)行聯(lián)合優(yōu)化,最終生成的擾動(dòng)同時(shí)抑制語(yǔ)義學(xué)習(xí)并強(qiáng)化線(xiàn)性捷徑,從而在深模型訓(xùn)練階段誘導(dǎo)其產(chǎn)生顯著的泛化退化。



圖 1:PIL 方法示意圖

PIL 的算法流程(簡(jiǎn)要)

1. 訓(xùn)練一個(gè)無(wú)偏置的線(xiàn)性分類(lèi)器作為代理模型;

2. 在不可察覺(jué)約束(L∞≤8/255)下,采用類(lèi)似 PGD 的方法優(yōu)化擾動(dòng);

3. 將擾動(dòng)注入原始圖像,構(gòu)造不可學(xué)習(xí)樣本;



Algorithm 1:PIL 算法流程

實(shí)驗(yàn)結(jié)果

我們?cè)?SVHN、CIFAR-10/100 和 ImageNet-100 數(shù)據(jù)集上,結(jié)合 ResNet、VGG、MobileNet 等多種模型進(jìn)行了系統(tǒng)評(píng)估。

1. 有效性

在不同數(shù)據(jù)集和模型架構(gòu)下,PIL 生成的不可學(xué)習(xí)樣本均能顯著降低模型的測(cè)試準(zhǔn)確率,在部分設(shè)置中準(zhǔn)確率接近隨機(jī)水平。



表 2:在干凈數(shù)據(jù)集(Dc)與 PIL 構(gòu)建的不可學(xué)習(xí)數(shù)據(jù)集(Du)上訓(xùn)練的模型在干凈數(shù)據(jù)上的測(cè)試準(zhǔn)確率(%)對(duì)比

2. 計(jì)算效率

在 CIFAR-10 上,PIL 生成擾動(dòng)僅需 40.53 秒,而 REM 方法需要超過(guò) 54k 秒,效率提升超過(guò)三個(gè)數(shù)量級(jí)。同時(shí),PIL 在效率與防護(hù)效果之間取得了較好的平衡。



表 3:不同方法為 CIFAR-10 訓(xùn)練集構(gòu)建全部擾動(dòng)所需的時(shí)間對(duì)比

3. 魯棒性

在多種數(shù)據(jù)增強(qiáng)策略(旋轉(zhuǎn)、裁剪、MixUp)和不同 JPEG 壓縮質(zhì)量下,PIL 依然保持穩(wěn)定的防護(hù)性能。



表 4:不同數(shù)據(jù)增強(qiáng)策略下,各類(lèi)不可學(xué)習(xí)樣本在 CIFAR-10 上的干凈測(cè)試準(zhǔn)確率(%)。結(jié)果越接近 10% 越好?;疑尘皹?biāo)示 Top-2 的兩種方法。



表 5:在不同 JPEG 壓縮質(zhì)量下,各類(lèi)不可學(xué)習(xí)樣本在 CIFAR-10 上的干凈測(cè)試準(zhǔn)確率(%)。結(jié)果越接近 10% 越好?;疑尘皹?biāo)示 Top-2 的兩種方法。

4. 線(xiàn)性化驗(yàn)證

我們使用 FGSM 攻擊下的準(zhǔn)確率下降幅度作為線(xiàn)性化指標(biāo)。實(shí)驗(yàn)表明,隨著 PIL 擾動(dòng)比例增加,模型對(duì) FGSM 的敏感性顯著增強(qiáng),驗(yàn)證了 PIL 確實(shí)誘導(dǎo)了模型的線(xiàn)性行為。



表 6:使用不同干凈 / PIL 擾動(dòng)數(shù)據(jù)混合比例訓(xùn)練的 ResNet-18 模型,在各 FGSM 攻擊步長(zhǎng)下的測(cè)試準(zhǔn)確率及下降幅度(%)

進(jìn)一步分析:

部分?jǐn)_動(dòng)設(shè)置下的性能退化受限

在實(shí)驗(yàn)中我們觀察到一個(gè)一致現(xiàn)象:當(dāng)僅有部分訓(xùn)練數(shù)據(jù)被擾動(dòng)時(shí),模型的測(cè)試準(zhǔn)確率往往不會(huì)出現(xiàn)顯著下降。這一現(xiàn)象并非 PIL 方法特有,而是現(xiàn)有不可學(xué)習(xí)樣本方法普遍存在的特性。

為解釋該現(xiàn)象,我們通過(guò)實(shí)驗(yàn)發(fā)現(xiàn)模型對(duì)被擾動(dòng)樣本產(chǎn)生的梯度與對(duì)干凈樣本的梯度呈現(xiàn)很強(qiáng)的正交性,于是我們提出在梯度正交假設(shè),并在該假設(shè)下進(jìn)行了理論分析,得到如下結(jié)論:

  • 干凈樣本與擾動(dòng)樣本在訓(xùn)練過(guò)程中所產(chǎn)生的梯度方向近似正交,因此擾動(dòng)樣本對(duì)應(yīng)的梯度更新難以顯著干擾模型對(duì)干凈樣本的學(xué)習(xí);
  • 在混合訓(xùn)練設(shè)置下,模型的泛化性能主要由干凈數(shù)據(jù)主導(dǎo),只要干凈樣本數(shù)量足夠,模型仍能學(xué)習(xí)到穩(wěn)定且可泛化的特征表示。



圖 2:在部分?jǐn)_動(dòng)場(chǎng)景下,CIFAR-10 數(shù)據(jù)集的干凈測(cè)試準(zhǔn)確率(%)

上述分析表明,部分?jǐn)_動(dòng)并不足以從根本上削弱模型的泛化能力。這一定性結(jié)論對(duì)于實(shí)際應(yīng)用具有直接啟示意義:若期望獲得穩(wěn)定且顯著的防護(hù)效果,需要對(duì)數(shù)據(jù)集進(jìn)行大比例甚至全部的擾動(dòng),或至少保證擾動(dòng)樣本在訓(xùn)練數(shù)據(jù)中占據(jù)足夠高的比例(通常高于 80%)。

結(jié)語(yǔ)

PIL 的核心在于從機(jī)制層面重新審視不可學(xué)習(xí)樣本問(wèn)題,將關(guān)注點(diǎn)從復(fù)雜的代理模型與攻擊策略,轉(zhuǎn)向「模型線(xiàn)性化」這一關(guān)鍵因素。通過(guò)使用線(xiàn)性代理模型,PIL 在顯著降低計(jì)算成本的同時(shí),依然保持了穩(wěn)定而有效的防護(hù)能力。

我們希望這一視角能夠?yàn)椴豢蓪W(xué)習(xí)樣本及相關(guān)數(shù)據(jù)保護(hù)研究提供新的思路,并推動(dòng)更加高效、可擴(kuò)展的方法設(shè)計(jì)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
三代王者同池競(jìng)技!張展碩奪200自冠軍,孫楊第6名力壓潘展樂(lè)

三代王者同池競(jìng)技!張展碩奪200自冠軍,孫楊第6名力壓潘展樂(lè)

全景體育V
2026-06-19 19:32:54
腿被踢斷,告別世界杯!24歲新星最新傷情,主帥表態(tài),肇事者發(fā)聲

腿被踢斷,告別世界杯!24歲新星最新傷情,主帥表態(tài),肇事者發(fā)聲

萌蘭聊個(gè)球
2026-06-19 10:56:25
莫言:你細(xì)心觀察一下你的身邊人,凡是動(dòng)不動(dòng)就生氣的人,沒(méi)有一個(gè)是智者,生活多半過(guò)得一團(tuán)糟糕

莫言:你細(xì)心觀察一下你的身邊人,凡是動(dòng)不動(dòng)就生氣的人,沒(méi)有一個(gè)是智者,生活多半過(guò)得一團(tuán)糟糕

每日一首古詩(shī)詞
2026-06-18 06:32:18
卡塔爾遭6球血洗,洛佩特吉怒噴加拿大:對(duì)手僅剩9人還不收手

卡塔爾遭6球血洗,洛佩特吉怒噴加拿大:對(duì)手僅剩9人還不收手

星耀國(guó)際足壇
2026-06-19 14:52:49
為讓中國(guó)加入北約,美國(guó)竟愿意白送武器,卻被我國(guó)無(wú)情拒絕

為讓中國(guó)加入北約,美國(guó)竟愿意白送武器,卻被我國(guó)無(wú)情拒絕

大運(yùn)河時(shí)空
2026-06-18 18:40:03
萬(wàn)斯警告以色列別不知好歹:特朗普是全球唯一同情以色列的國(guó)家元首;以色列的防御武器三分之二由美國(guó)制造、美國(guó)納稅人出資

萬(wàn)斯警告以色列別不知好歹:特朗普是全球唯一同情以色列的國(guó)家元首;以色列的防御武器三分之二由美國(guó)制造、美國(guó)納稅人出資

大象新聞
2026-06-19 13:45:24
97年我娶了離過(guò)婚的女教師,洞房夜她把燈關(guān)了:我有件事要告訴你

97年我娶了離過(guò)婚的女教師,洞房夜她把燈關(guān)了:我有件事要告訴你

千秋文化
2026-06-18 20:19:03
把高純鎢轉(zhuǎn)賣(mài)日本?韓國(guó)自食其果,高市沒(méi)料到,中方動(dòng)作這么快

把高純鎢轉(zhuǎn)賣(mài)日本?韓國(guó)自食其果,高市沒(méi)料到,中方動(dòng)作這么快

共工之錨
2026-06-19 15:28:53
免學(xué)費(fèi)住宿費(fèi),每月給生活費(fèi)!34所中國(guó)高校去泰國(guó)去招生,引熱議

免學(xué)費(fèi)住宿費(fèi),每月給生活費(fèi)!34所中國(guó)高校去泰國(guó)去招生,引熱議

火山詩(shī)話(huà)
2026-06-19 06:30:55
歷史要?dú)в谝坏??蒙古?guó),正在把中國(guó)40年的努力毀掉!

歷史要?dú)в谝坏棵晒艊?guó),正在把中國(guó)40年的努力毀掉!

李云飛Afey
2026-06-18 19:47:26
大媽順走奔馳螺絲后續(xù)!長(zhǎng)相曝光,被老板找到后說(shuō):以為你不要了

大媽順走奔馳螺絲后續(xù)!長(zhǎng)相曝光,被老板找到后說(shuō):以為你不要了

寒士之言本尊
2026-06-18 17:37:03
山姆高層大逃亡,真相觸目驚心

山姆高層大逃亡,真相觸目驚心

新浪財(cái)經(jīng)
2026-06-18 19:02:44
寶媽避雨被趕后續(xù):大批顧客退單,道歉也難平眾怒,門(mén)店口碑崩了

寶媽避雨被趕后續(xù):大批顧客退單,道歉也難平眾怒,門(mén)店口碑崩了

北緯的咖啡豆
2026-06-18 21:59:34
世界杯賽后爆發(fā)大規(guī)模沖突,比起6比0 更慘的是斷腿重傷

世界杯賽后爆發(fā)大規(guī)模沖突,比起6比0 更慘的是斷腿重傷

削桐作琴
2026-06-19 17:14:33
女孩被狼群養(yǎng)大18年,檢查時(shí)醫(yī)生發(fā)現(xiàn)她肚子里,竟有東西在動(dòng)

女孩被狼群養(yǎng)大18年,檢查時(shí)醫(yī)生發(fā)現(xiàn)她肚子里,竟有東西在動(dòng)

墨染塵香
2026-06-18 18:10:09
一場(chǎng)遲到的“斷舍離”,山水酒店連虧6年負(fù)債5.25億元,中青旅忍痛切割

一場(chǎng)遲到的“斷舍離”,山水酒店連虧6年負(fù)債5.25億元,中青旅忍痛切割

華夏時(shí)報(bào)
2026-06-19 10:10:05
四川:明確重點(diǎn)打擊惡意退保等違法業(yè)態(tài)

四川:明確重點(diǎn)打擊惡意退保等違法業(yè)態(tài)

北京商報(bào)
2026-06-18 18:14:03
FIFA:因科內(nèi)重傷世界杯報(bào)銷(xiāo),薩索洛可獲最高750萬(wàn)歐元補(bǔ)償

FIFA:因科內(nèi)重傷世界杯報(bào)銷(xiāo),薩索洛可獲最高750萬(wàn)歐元補(bǔ)償

懂球帝
2026-06-19 11:03:12
整治冒充、偽裝、夾帶、黑灰產(chǎn)!中央網(wǎng)信辦專(zhuān)項(xiàng)治理賬號(hào)亂象

整治冒充、偽裝、夾帶、黑灰產(chǎn)!中央網(wǎng)信辦專(zhuān)項(xiàng)治理賬號(hào)亂象

南方都市報(bào)
2026-06-19 10:41:10
極速達(dá),害了山姆

極速達(dá),害了山姆

中國(guó)新聞周刊
2026-06-19 13:14:39
2026-06-19 20:03:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專(zhuān)業(yè)的人工智能媒體
13299文章數(shù) 142674關(guān)注度
往期回顧 全部

科技要聞

Anthropic被禁,智譜卻漲瘋了

頭條要聞

婚禮短片現(xiàn)"別人老公老婆"新娘忍整場(chǎng) 不料有更離譜的

頭條要聞

婚禮短片現(xiàn)"別人老公老婆"新娘忍整場(chǎng) 不料有更離譜的

體育要聞

世界杯最不知名球員,沒(méi)上場(chǎng)先漲粉600萬(wàn)

娛樂(lè)要聞

吳倩自曝小時(shí)被爸爸打掉牙齒硬吞進(jìn)肚

財(cái)經(jīng)要聞

Token低價(jià)陷阱

汽車(chē)要聞

驚出冷汗!重慶實(shí)測(cè)奧迪A5L,華為智駕這波操作絕了…

態(tài)度原創(chuàng)

健康
家居
數(shù)碼
游戲
藝術(shù)

吃粽子的3條保胃法則,消化科醫(yī)生推薦

家居要聞

綠意盎然 自然之境

數(shù)碼要聞

視頻轉(zhuǎn)碼性能最高提升215%:AMD線(xiàn)程撕裂者突破HandBrake瓶頸

給玩家“下藥”!《女神異聞錄6》總監(jiān):主打毒藥式體驗(yàn)

藝術(shù)要聞

俄羅斯襲擊烏克蘭基輔,千年洞窟修道院陷火海

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版