学院新闻

分享

    信息学部学生在国际语义分割竞赛中获佳绩

    发布时间:2018.11.19

    我院信息学部计算机应用技术实验室黎健成同学(计算机2015级,导师袁春副研究员)近期在国际图像语义分割著名数据集Pascal VOC2012竞赛中提交的分割结果荣获第二名的好成绩。

    18.jpg

    图为比赛结果(我院结果为图中第二行)

    PASCAL VOC2012是国际著名的物体检测和分割数据集,为图像识别和分类提供了一整套标准化的评测标准,从2005年开始每年都会举行一场图像识别竞赛。此数据集可以用于图像分类、目标检测、图像分割,是图像语义分割领域的标杆。

    此次我院提交的图像语义分割方法,主要基于当前最优秀的语义分割模型之一——DeepLab v3+,在DeepLab v3+的基础上,使用了目前语义分割领域的一种高效的结构——多孔空间金字塔池化(ASPP),并且在ASPP上创造性地加入了注意力(Attention)机制,最终的模型DeepLab v3+_AASPP获得了88.5的平均正确率,在Pascal VOC2012准确率排行榜上取得第二名的成绩,仅次于Google提出的有大型数据集JFT加成的DeepLab v3+模型。

    此次我院的成果展示了我院在计算机视觉领域雄厚的实力,受到普遍的关注和好评。(王子愉)

    17.jpg

    上图为所采用的整体结构,左下图为多孔空间金字塔池化模块,右下图为提出的注意力模型的结构