无需任何训练,加速扩散模型的DeepCache开源！

161次阅读

一条评论

今天我要为大家讲解一个最近在图像生成领域持续热门的话题 – 扩散模型及其加速方法。内容安排如下:

第一部分什么是扩散模型

第二部分扩散模型的问题与 DeepCache 方法

第三部分 DeepCache 的实现原理和策略

第四部分 DeepCache 的实验结果

第五部分 DeepCache 的代码实现

下面让我们一一进入这些内容。

第一部分什么是扩散模型

扩散模型是一类基于深度神经网络的生成模型, 可以生成逼真的图像。它的基本思路是, 从一张随机噪声图像开始, 通过多步推理逐步去除图像中的噪声, 合成出清晰的图片。代表模型有 Stable Diffusion 等。

第二部分扩散模型的问题与 DeepCache 方法

扩散模型需要进行多步计算, 每一步都要运行完整的模型去噪, 非常耗时。而在邻近去噪步骤中, 模型深层特征变化很小。这启发了 DeepCache 方法。

DeepCache 的核心思路是重用相似的深层特征, 只更新浅层特征。具体的是, 每隔若干步进行一次完整推理来更新深层特征缓存, 中间步骤只运行浅层网络, 直接使用缓存的深层特征, 以跳过大部分计算。

第三部分 DeepCache 的实现原理和策略

DeepCache 利用了 U 型网络的跳过连接结构。在下采样和上采样中, 通过跳过连接传递更多信息。作者发现, 上采样时深层特征变化很小, 主要采集了全局信息。所以可以重用深层特征缓存, 只更新浅层特征。

DeepCache 提出了均匀缓存和非均匀缓存两种策略。均匀缓存是固定每 N 步全网推理一次。非均匀缓存根据层特征变化情况动态调整不同层的缓存频率。

第四部分 DeepCache 的实验结果

作者在多个模型上验证了 DeepCache, 包括 Stable Diffusion、LDM 和 DDPM, 都取得了显著的加速效果。仅用简单的均匀缓存, 就可使 Stable Diffusion 加速 2.3 倍, 几乎无损。

第五部分 DeepCache 的代码实现

DeepCache 的实现很简单, 只需要用它提供的模型替换原始模型, 接口调用方式不变, 就可以实现加速效果。

以上是我对 DeepCache 方法的全面概述。它无需训练就可以轻松实现扩散模型的显著加速, 是一个非常有价值的工作。更多细节我们可以在讨论时继续深入。如果有任何问题, 欢迎同学们积极提出, 我们一起讨论。

https://github.com/horseee/DeepCache

正文完

发表至： AGI

2023-12-19

大模型能力的“涌现”机制被谷歌发现

大语言模型的加速之道：思维骨架(Skeleton-of-Thought)

揭秘LocalAI.io——打造智能化未来的引领者

YAYI2 模型

Mixtral-8x7B 背后的 MoE 技术

图生文BLIP-2：图生文大语言图像预训练引导

评论（一条评论）

C3P00

2023-12-19 06:42:54 回复

DeepCache方法的优势主要体现在以下几个方面：
无需额外训练
DeepCache方法无需对原始模型进行额外的训练，因此不会增加额外的训练成本和时间。这对于已经训练好的模型来说非常有利，可以直接应用于现有模型上，实现快速的加速效果。
几乎无损失的压缩加速效果
通过避免重复计算冗余的深层特征，DeepCache方法可以实现几乎无损失的压缩加速效果。在实验中，该方法在加速模型的同时，几乎不会损失图像生成的质量，甚至在某些情况下，还能取得更好的性能。
可应用于多种模型
DeepCache方法目前支持Stable Diffusion v1.5/v2.1/XL等主流扩散模型。这意味着这种加速方法不仅适用于特定的模型，而且具有一定的通用性，可以应用于多种不同类型的模型上。
灵活的加速策略
DeepCache方法提供了Uniform和Non-Uniform两种加速策略，使得用户可以根据具体需求选择合适的加速方式。这种灵活性使得DeepCache方法在不同场景下都能够发挥出较好的加速效果。
总的来说，DeepCache方法的优势在于其简单高效的加速方式，以及对模型性能损失的极小影响，使得它成为一种非常有潜力的模型加速方法。

Macintosh Safari 未知