CVPR 2018 腾讯团队
目前,大多数图像描述工作都是基于单个图像的在线描述,忽略了群组图像之间的关联度和多样性。在许多真实世界的应用程序中,如描述相册或事件,图像不适合单独描述。《GroupCap: Group-based Image Captioning with Structured Relevance and Diversity Constraints》这篇论文提出提了基于群组的图像描述架构:GroupCap,联合建模群组图像之间的结构化关联性和多样性,以实现最佳的协作描述。作者认为,群组图像中基于群组的描述的基本问题在于:以离线的方式从视觉角度对其相关性(Correlation)建模,相关性就包括关联性(Relevance)和多样性(Diversity)。一方面,视觉结构相关性可以准确地建模群组内图像在离线训练期间的细粒度多样性;另一方面,学习这种离线的视觉结构可以更好的捕获并准确的解释群组间图像的关联性。目前,大多数图像描述工作都是基于单