科研亮点

返回
信息学部学生郭靖宇、刘镛获2021 CVPR奖项

发布时间:2021-11-15

近日,我院信息科学与技术学部学生郭靖宇和刘镛荣获2021年国际计算机视觉与模式识别会议(2021 CVPR)奖项,分别获得NTIRE 2021 Challenge on Perceptual Image Quality Assessment 第三名和CVPR 2021 The 3rd Large-Scale Video Object Segmentation Challenge第三名。

 

 

2019级硕士生郭靖宇(导师:杨文明副教授)的获奖论文为《针对生成对抗网络生成图像的感知质量评价网络 L2PIPS》(Learn to Learn a Perceptual Image Patch Similarity)。该文章主要关注面向生成对抗网络(GAN)生成图像的质量评价算法,解决了现有图像质量评价方法对于GAN生成退化的不适用性问题。图像质量评价旨在利用算法对数字图像的质量进行自动化评价,在图像的生成、复原与图像检索等领域有着广泛的应用,其中最重要的应用之一是衡量图像复原算法的性能。然而,随着生成对抗网络(GAN)在复原领域的广泛应用,GAN所生成图像的独特属性也为图像质量评价带来了新的挑战。为此,郭靖宇提出了一个深度特征相似性度量模块,并设计了一个面向GAN生成图像的质量评价模型。该模型利用孪生网络结构提取图像的深度特征,基于注意力机制进行深度特征的相似性提取,最终将多尺度特征回归质量指标。

 

方法框架图

 

获奖证书

 

 

2020级硕士生刘镛(导师:杨余久副教授)的获奖论文为《针对视频目标分割的质量感知和先验增强的记忆网络》(Quality-aware and Prior Enhancement Memory Network for Video Object Segmentation)。该文章主要关注并解决了视频目标分割领域中参考帧质量参差不齐的问题,此外还利用关键帧提供了模糊的先验以挖掘帧内信息。视频目标分割旨在分割出视频中特定的目标物体,其在自动驾驶、视频编辑等领域都有重要应用。近年来,基于当前帧与参考帧匹配的方法占据了该领域的主流。然而,此前的方法大多关注于如何更好的匹配,却忽略了参考帧本身质量好坏对于分割的影响。针对这个问题,刘镛提出了一个质量评估模块来对每一帧的分割结果进行评估,通过评估分数来控制该帧是否可以作为参考帧。在该模块的作用下,参考帧的质量得到了提高,分割效果也有了提升。同时由于分割效果变好,又进一步促进了参考帧质量的提高,形成了良性循环。此外,刘镛还进一步利用了关键帧信息,提供模糊的先验来挖掘当前帧的特征。刘镛在CVPR2021 The 3rd Large-Scale Video Object Segmentation Challenge中获得了第三名的成绩,在不使用多尺度测试等trick的情况下效果不输前两名的方法。此外,该方法还在领域内所有数据集上取得了state-of-the-art的效果。

 

方法框架图

 

获奖证书

 

文:洪明春

图:郭靖宇、刘镛

编辑:余飞慧


版权所有@清华大学深圳国际研究生院 京ICP备15006448号 京公网安备 110402430053 号