1. 引言
Stable Diffusion 是由 Stability AI 开发的开源文本到图像生成模型,自 2022 年发布以来在创意产业和研究领域引起了广泛关注。它基于潜在扩散模型架构,能够根据文本描述生成高质量的图像内容,为艺术创作、设计和内容生成提供了强大工具。
2. 技术原理详解
2.1 扩散模型基础
扩散模型的核心思想是通过两步过程实现图像生成:
- 正向过程:逐步向图像添加高斯噪声,直到图像被完全破坏
- 反向过程:从随机噪声开始,逐步预测并移除噪声,重建原始图像
数学上,扩散过程可以表示为:
其中 是噪声调度参数,控制每一步添加的噪声量。