返回
一种基于多数据集的肺音分类系统

发布时间:2024-09-12


专利示意图

一、技术领域

肺音识别分类技术领域


二、专利介绍

1.专利信息

专利类型:发明

专利权人:清华大学深圳国际研究生院

申请号:202310485987.X

发明人:解书照、王智、许国贤、雷桑

2.专利说明书摘要

本发明公开了一种基于多数据集的肺音分类系统,包括归化模块、分类辅助模块、肺音分类模块,其中,归化模块用于根据不同肺音数据集的类别间的对应关系归化融合至少两个肺音数据集,从而获得融合后的归化数据集;分类辅助模块用于根据归化数据集构建、训练预分类模型,从而得到预分类模型在归化数据集中对肺音数据分类精度最高的分类参数;肺音分类模块用于根据分类参数构建肺音分类模型,对肺音数据进行分类并输出肺音分类结果;本发明能够解决肺音识别过程中数据赤字和多个数据集之间类别组合不统一的问题,从而利用多数据集提高肺音数据分类的精度。

3.创新点

(1)本发明涉及呼吸音识别领域,针对整合不同数据集的标签需要大量专业领域人士的工作量和容易出错的情况,提出一种完全基于已有数据的标签统一方法和使用无标签肺音数据训练模型的方法;

(2)所提出在分类任务上的低复杂性标签对齐方法可以提高用户异常肺阴识别率;

(3)本方法精度高于已有同类方法,是一种很有潜力的异常肺音预测方法。

4.痛点问题

(1)整合来自不同数据集的标签耗时长且容易出错;

(2)许多未标记的肺音数据中包含珍贵的信息,但却无法使用;

(3)多个数据集之间的冲突往往导致模型的精度下降。

5.技术优势

(1)将分类问题下的多数据集联合训练问题建模成可解的0-1线性规划问题,最终的类别对应方案在测试集合上取得了较好的性能,首次将多数据集训练方法引入肺音识别模型;

(2)提出半监督训练方法和使得数据更加平衡的训练技巧,解决了不同数据集分布不同导致的精度下降问题,对肺部健康检测有其重大意义;

(3)本方案训练流程简单,重训练和推理时间短,有效节约成本。


三、产业化信息

1.应用场景

(1)可以给出精度更高、推理速度更快的机器学习API,可以提供给其他商业公司;

(2)对于模型训练而言,合适的训练方法能加速模型收敛并取得更高的精度,通过我们基于半监督方法的训练方式和使得数据更加平衡的训练技巧,可以更快的使模型收敛和适应于新的标签,并取得更高精度,可以提供给其他科研院所。

2.商业价值

此项技术拥有巨大的商业前景,对于医疗健康行业有以下市场价值:

(1)本模型可以和自身的电子听诊器结合,形成具有非凡市场竞争力的产品;

(2)本模型可包装成机器学习推理服务租售给其他商业公司。

3.发展规划

(1)该技术未来可应用至我国医疗资源不充分的地区,实现电子听诊器国产化,快速提高我国欠发达地区的肺部疾病诊断准确率;

(2)该技术通过推广高精度的肺音诊断、及时的顶级医生远程停诊服务及廉价的电子听诊器等方式均可能占据市场。

4.合作方式

面议



注:所有成果未经授权,请勿转载

联系方式:ttc@sz.tsinghua.edu.cn



版权所有@清华大学深圳国际研究生院 京ICP备15006448号 京公网安备 110402430053 号