我们提出了 SalUn,这是一个基于权重显著性的机器遗忘框架,它有效地解决了现有 MU 方法的局限性,并适用于图像分类和生成任务。SalUn 在防止稳定扩散生成有害内容方面非常有效,即使遇到不当图像提示也是如此。
随着数据法规的不断演变,机器遗忘 (MU) 已成为增强当今人工智能模型信任度和安全性的重要工具。然而,现有的 MU 方法侧重于数据和/或权重视角,在遗忘准确性、稳定性和跨领域适用性方面往往存在局限性。为了应对这些挑战,我们引入了 MU 的“权重显著性”概念,并将其与模型解释中的输入显著性进行了类比。这一创新将 MU 的注意力从整个模型转移到特定的模型权重上,从而提高了有效性和效率。由此产生的方法被称为显著性遗忘 (SalUn),它缩小了与“精确”遗忘(从移除遗忘数据点后从头开始重新训练模型)的性能差距。据我们所知,SalUn 是第一个能够有效消除遗忘数据、类别或概念在图像分类和生成任务中的影响的原则性 MU 方法。例如,SalUn 在高方差随机数据遗忘中具有稳定性优势,例如,在 CIFAR-10 数据集上与精确遗忘相比,差距为 0.2%。此外,在防止条件扩散模型生成有害图像方面,SalUn 实现了近 100% 的遗忘准确率,优于当前最先进的基线,如 Erased Stable Diffusion 和 Forget-Me-Not。代码可在 https://github.com/OPTML-Group/Unlearn-Saliency 获取。
_____ 本文包含的模型输出可能具有冒犯性。
SalUn:权重显著性是 MU 的关键
为了解决上述局限性,我们提出了 SalUn,它利用了梯度信息来构建权重显著性图,并将其用于指导遗忘过程。
我们借鉴了梯度信息在输入显著性图中的应用,提出了构建权重显著性图来辅助 MU 的想法。权重显著性图可以将预遗忘模型权重 (θo) 分解为两个不同的部分:在 MU 期间标记为更新的显著模型权重和保持不变的完整模型权重。
我们使用遗忘损失 (`f(θ; Df)) 相对于遗忘数据集 Df 下模型权重变量 θ 的梯度,并应用硬阈值操作来获得权重显著性图:
其中 1(g ≥ γ) 是一个元素级指示函数,如果 gi ≥ γ,则第 i 个元素的值为 1,否则为 0,|·| 是元素级绝对值运算,γ > 0 是硬阈值。
基于权重显著性图,我们可以将遗忘模型 θu 表示为:
其中 是元素级乘积,1 表示全 1 向量。这意味着在 MU 期间的权重更新中,注意力可以集中在显著权重上。
SalUn 的实现
SalUn 将权重显著性图 (mS) 集成到遗忘过程中,并利用随机标签 (RL) 方法来更新显著权重。
在图像分类中,SalUn 的优化问题可以表示为:
其中 y0 是与 y 不同的随机图像标签,θu 已在 (4) 中定义。
在图像生成中,SalUn 的优化问题可以表示为:
其中 c0 ≠ c 表示概念 c0 与 c 不同,θu 是由 (4) 给出的基于显著性的遗忘模型,β > 0 是一个正则化参数,用于在遗忘数据集 Df 上的基于 RL 的遗忘损失与非遗忘数据集 Dr 上的扩散训练损失 `MSE(θu; Dr) 之间进行优化权衡。
我们在图像分类和生成任务上进行了大量的实验,验证了 SalUn 的有效性。
在图像分类任务中,我们重点关注随机数据遗忘,并在 CIFAR-10 数据集上使用 ResNet-18 模型进行评估。我们比较了 SalUn 与其他 7 种 MU 基线方法的性能,包括 FT、RL、GA、IU、`1-sparse、BS 和 BE。
实验结果表明,SalUn 在两种遗忘场景(10% 随机数据遗忘和 50% 随机数据遗忘)中均实现了与 Retrain 最小的平均性能差距。此外,SalUn 在遗忘效果 (UA 和 MIA) 和模型保真度 (RA 和 TA) 之间取得了最佳平衡,同时保持了计算效率。
在图像生成任务中,我们重点关注两种遗忘场景:使用 DDPM 的类遗忘和使用 LDM 的概念遗忘。
实验结果表明,SalUn 在类遗忘和概念遗忘任务中均优于其他 MU 基线方法,同时保持了良好的图像生成质量。
NSFW 概念遗忘
我们还评估了 SalUn 在概念遗忘中的有效性,以消除通过不当图像提示 (I2P. 引入的 NSFW 概念的影响。
实验结果表明,SalUn 生成的有害图像最少,显著优于其他 MU 基线方法。
_____ : 这篇论文试图解决什么问题?
_____ : 这篇论文试图解决的问题是机器学习(ML)模型中的机器遗忘(Machine Unlearning, MU)问题。具体来说,它关注以下几个关键点:
为了解决这些问题,论文提出了一种新的MU方法,称为“权重显著性”(Weight Saliency),并开发了一种名为SalUn(Saliency Unlearning)的方法。这种方法通过关注模型中的特定权重而不是整个模型,提高了MU的有效性和效率。SalUn旨在缩小与精确遗忘(从头开始重新训练模型)的性能差距,并在图像分类和生成任务中实现有效的遗忘。
_____ : 有哪些相关研究?
_____ : 论文中提到的相关研究领域和具体工作包括:
_____ : 论文如何解决这个问题?
_____ : 论文通过引入“权重显著性”(Weight Saliency)的概念来解决机器遗忘(MU)问题,并提出了一种名为SalUn(Saliency Unlearning)的方法。以下是SalUn方法的关键步骤和特点:
_____ : 论文做了哪些实验?
_____ : 论文中进行了一系列的实验来验证SalUn方法的有效性,这些实验包括:
_____ : 有什么可以进一步探索的点?
_____ : 尽管SalUn方法在机器遗忘领域取得了显著的进展,但仍有一些潜在的研究方向可以进一步探索:
_____ : 总结一下论文的主要内容
_____ : 这篇论文的主要内容可以总结如下: