Text to Image的发展历程是一个充满创新与突破的过程,以下是其详细介绍:
早期探索阶段
- 在深度学习兴起之前,构建Text to Image模型的尝试主要局限于通过拼接现有图像组件来制作拼贴画,例如利用剪贴画数据库中的图像进行组合 。
基于GAN的初步尝试阶段
- 2015年:多伦多大学的研究人员推出了第一个现代意义上的Text to Image模型AlignDraw,它扩展了之前的Draw架构,使用带有注意力机制的循环变分自编码器,并以文本序列为条件生成图像。不过,其生成的图像较为模糊,不够逼真,但具有一定的泛化能力,能够处理训练数据中未出现过的物体和新颖的提示.
- 2016年...