专利成果展示

一种基于深度隐式网络的缺陷检测方法与模型

发布时间:2023.08.13


专利示意图

一、技术领域

计算机视觉与图像信号处理领域


二、专利介绍

1.专利信息

专利类型:发明

专利权人:清华大学深圳国际研究生院

申请号:202310302286.8

发明人:王好谦、殷俊、刘智方

2.专利说明书摘要

本发明公开了一种基于深度隐式网络的缺陷检测方法与模型,方法包括:S1、模型构建:利用多尺度混合窗口自注意力模块和深度隐式网络搭建缺陷检测模型,该模型包括特征编码分支和基于深度隐式网络的图像恢复分支;S2、模型训练:以非固定而由具体任务确定分辨率的图像为输入,获取图像特征图、缺陷编码图和由深度隐式网络复原的与输入同分辨率或高分辨率的图像,以图像复原损失作为主要监督信号;S3、推理阶段:获取缺陷编码图,确定缺陷类别与位置。

3.创新点

(1)本专利申请公开了一种基于深度隐式网络的缺陷检测方法,属于计算机视觉领域与缺陷检测领域;

(2)方法的核心思想在于解耦待检测工件外观描述与各类缺陷描述,同时在解耦过程中确保了信息损失;

(3)采用包含周期性激活函数和位置编码的隐式网络取代常见的以卷积为主要架构的解码器网络,并利用基于多层次窗口注意力机制的特征编码器网络结构获取特征编码方法在图像恢复损失之外进一步约束不同类别特征编码的分布,使得缺陷类别间编码距离大于缺陷类别内部特征编码距离。

4.痛点问题

(1)提高了缺陷检测的精度;

(2)适用于对数据量要求高的检测场景;

(3)解决了编码-解码过程中的信息损失问题。

5.技术优势

(1)减轻了数据依赖,适用于对数据量要求高的检测场景;

(2)网络可以适应从像素级毛刺到整体色彩偏差的不同尺寸缺陷类型。


三、产业化信息

1.应用场景

配合相机及镜头可在实际的工程场景下完成零部件的缺陷检测分类

2.商业价值

此项技术拥有巨大的商业前景,对于制造行业有以下市场价值:

(1)国内机器视觉市场规模自2021年起将保持27%左右的高速增长水平,预计到2023年国内机器视觉市场规模将接近300亿元;

(2)从下游应用来看,消费电子是机器视觉目前主要的应用领域,而汽车、锂电、半导体等是未来的主要增长点,目前国内机器视觉主要是以外资品牌为主,本项技术可通过技术突破开启进口替代进程。

3.发展规划

寻找具有相应场景的企业合作落地,部署到实际工业场景

4.合作方式

面议



注:所有成果未经授权,请勿转载

联系方式:ttc@sz.tsinghua.edu.cn