一、技术背景与核心问题 AI绘画模型(如基于扩散模型的Stable Diffusion架构)的生成质量高度依赖训练数据分布与参数配置。传统监督学习方法依赖标注数据,难以处理动态审美偏好变化;而增强学习通过环境反馈动态……