在GPU云服务器中部署Stable Diffusion web UI：从零开始的完整指南

引言

Stable Diffusion作为当前最热门的开源AI绘画模型之一，其web UI版本（如AUTOMATIC1111的WebUI）极大降低了用户的使用门槛。然而，本地部署受限于硬件性能（尤其是GPU算力），而通过GPU云服务器部署则能突破这一瓶颈，实现高效、稳定的模型运行。本文将详细介绍如何在GPU云服务器上完成Stable Diffusion web UI的部署，包括环境准备、依赖安装、代码配置及优化建议。

一、选择合适的GPU云服务器

1.1 云服务商选择

主流云服务商（如AWS、Azure、阿里云、腾讯云等）均提供GPU实例服务。选择时需关注：

GPU型号：推荐NVIDIA A100/V100/T4等，算力越强，生成速度越快。
实例规格：根据预算选择单卡或多卡配置，多卡需支持NVLink或PCIe互通。
网络带宽：高速网络（如10Gbps以上）可减少数据传输延迟。
存储类型：SSD存储（如NVMe）可提升模型加载速度。

1.2 操作系统与镜像

推荐使用Ubuntu 20.04/22.04 LTS，因其兼容性好且社区支持丰富。部分云服务商提供预装CUDA和驱动的镜像，可简化部署流程。

二、环境准备与依赖安装

2.1 安装NVIDIA驱动与CUDA

禁用默认驱动：

sudo apt-get purge nvidia*
sudo apt-get autoremove

安装驱动：

从NVIDIA官网下载对应驱动（如NVIDIA-Linux-x86_64-535.154.02.run）。

禁用Nouveau驱动：

echo "blacklist nouveau" | sudo tee /etc/modprobe.d/blacklist-nouveau.conf
sudo update-initramfs -u
sudo reboot

安装驱动：

chmod +x NVIDIA-Linux-x86_64-*.run
sudo ./NVIDIA-Linux-x86_64-*.run

安装CUDA：

下载CUDA Toolkit（如cuda_11.8.0_520.61.05_linux.run）。

安装：

sudo sh cuda_11.8.0_*.run --silent --toolkit --override

配置环境变量：

echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

2.2 安装Python与依赖

安装Python 3.10：

sudo apt-get update
sudo apt-get install python3.10 python3.10-venv python3.10-dev

创建虚拟环境：

python3.10 -m venv sd_venv
source sd_venv/bin/activate

安装依赖：

pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu118
pip install -r requirements.txt  # 从Stable Diffusion仓库获取

三、部署Stable Diffusion web UI

3.1 克隆代码仓库

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
cd stable-diffusion-webui

3.2 配置启动参数

编辑webui-user.sh（Linux）或webui-user.bat（Windows），调整以下参数：

GPU内存分配：

export COMMANDLINE_ARGS="--medvram"  # 中等显存模式，或"--lowvram"

端口与IP：

export COMMANDLINE_ARGS="--listen --port 7860"

模型路径：

export STABLE_DIFFUSION_MODEL_PATH="/path/to/models/Stable-diffusion"

3.3 启动服务

./webui.sh  # Linux
# 或双击webui-user.bat（Windows）

启动后，访问http://<服务器IP>:7860即可使用。

四、优化与调试

4.1 性能优化

模型量化：使用--opt-sdp-no-mem-attention或--xformers加速注意力计算。
多卡并行：通过--device-id 0,1指定多卡（需支持）。
缓存优化：使用--no-half-vae避免VAE半精度问题。

4.2 常见问题解决

CUDA内存不足：
- 降低--medvram为--lowvram。
- 减少batch_size或height/width。
驱动冲突：
- 检查nvidia-smi是否显示GPU信息。
- 重新安装驱动并禁用Nouveau。
端口冲突：
- 修改--port参数或检查防火墙规则。

五、安全与维护

5.1 安全建议

限制访问：通过Nginx反向代理配置基本认证或IP白名单。
数据备份：定期备份模型和输出目录。
日志监控：使用journalctl -u sd_webui查看服务日志。

5.2 更新与扩展

模型更新：从CivitAI或Hugging Face下载新模型，放入models/Stable-diffusion。
插件安装：通过WebUI的“Extensions”标签页安装插件（如ControlNet）。

结论

通过GPU云服务器部署Stable Diffusion web UI，开发者可充分利用云端算力，实现高效、稳定的AI绘画服务。本文从环境准备、依赖安装到优化调试，提供了完整的操作指南。实际部署时，建议根据硬件配置调整参数，并定期维护系统以确保稳定性。未来，随着模型和硬件的升级，部署流程将进一步简化，为AI创作提供更强大的支持。