引言 近年来,随着深度学习技术的突破性发展,生成式建模技术(Generative Modeling)在图像与文本领域展现出惊人的创造力。从文本生成图像(Text-to-Image)到图像描述生成(Image Captioning),再到跨模态内容……