图8展示了通过插值学习的文本流形(左)。虽然插值点没有真实的文本,但生成的图像看起来是合理的。由于我们保持噪声分布不变,每一行中唯一变化的因素是我们使用的文本嵌入。请注意,插值可以准确地反映颜色信息,例如鸟从蓝色变为红色,而姿势和背景保持不变。

除了在两个文本编码之间进行插值,我们在图8(右侧)展示了噪声插值的结果。在这里,我们采样两个随机噪声向量。通过保持文本编码不变,我们在这两个噪声向量之间插值,通过保持内容不变生成具有平滑过渡的鸟类图像。

文本插值与噪声插值:生成逼真鸟类图像

原文地址: https://www.cveoy.top/t/topic/nH9N 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录