- 课程回放
- 条件生成对抗网络及其衍生模型
- 生成图像多样性不足的问题研究
- 基于对比学习增强图像生成的多样性
- 在不同图像任务中的应用
在11月16日「生成对抗网络GAN专题讲座」第1讲中,独立艺术家、游戏开发者大谷Spitzer详细解析了AI影响修复和艺术创作的整体流程、遇到的难点与解决方法、自制案例等内容。错过直播的朋友可以点击文章底部的“阅读原文”观看。
11月22日,香港中文大学MMLab在读博士刘睿将参与到「生成对抗网络GAN专题讲座」第2讲的直播讲解,主题为《基于条件生成对抗网络的多样化图像生成》。
对于图像生成任务,主要是通过生成模型来完成,包括层出不穷的GAN,不同变版的VAE,pixelCNN、pixelRNN等。其中,GAN是用的最多的,也是效果最好的,从不存在的人脸到生成各类的动漫人物、风景画等都可以用GAN做到。
条件生成对抗网络cGAN是最经典的GAN衍生模型之一,它对原始的GAN附加了约束,即在生成模型和判别模型中引入条件变量,使得模型可以生成符合给定条件的图像。但目前大多数的cGAN模型仅生成了一种或两种图像,而现实场景中,我们希望它是无所不能的,可以生成各种我们想要的图像。那如何让cGAN模型生成多样化的图像呢?
许多工作尝试增强输入潜变量和输出图像之间的相关性,以确保潜变量可以控制生成的图像。但这些方法仅考虑了单个潜变量与其生成图像之间的关系,其他潜变量与生成图像之间的关系则被忽略,同时它们还设计了复杂损失函数和额外网络,使得这些方法需要更多的计算开销,并难以即插即用。
在各种机器学习模型中,由于自监督学习中的对比学习可以充分的每个变量之间的关系,因此利用对比学习挖掘每个生成图像和输入潜变量之间的对应关系,在多样化图象生成中展现了很大的潜力。那怎样把对比学习融入到cGAN中实现多样化的图像生成呢?本次讲座带你揭秘。
刘睿是香港中文大学MMLab的在读博士,研究方向为深度生成模型以及其在low-level视觉任务上的应用,并以一作身份发表四篇CVPR、ICCV。
本次讲座将在智东西公开课知识店铺进行,包含主讲和问答两个部分,其中主讲环节40分钟,问答环节20分钟。本次讲座已组建交流群,并邀请刘睿博士加入,欢迎感兴趣的朋友申请。