发布时间:2023.02.15

吴志勇团队在2023 语音信号质量增强挑战赛中荣获冠军

近日,国际声学、语音与信号处理会议(International Conference on Acoustics, Speech and Signal Processing,ICASSP)联合微软发起的 2023 语音信号质量增强挑战赛(Speech Signal Improvement Challenge, SSIC)结果公布。本次挑战赛吸引了全球学术界众多高校以及工业界团队。我院信息科学与技术学部吴志勇团队联合腾讯会议旗下天籁实验室荣获SSIC两个赛道的冠军,团队成员包括我院计算机技术项目2021级硕士生陈鋆。

挑战赛主要围绕如何在实时通信系统中提升语音的信号质量,除了噪声消除之外,还包括多种复杂声学条件下的混响、丢包、设备采集、前处理损伤失真等难题。比赛分为实时和非实时处理两个赛道,以ITU-T P.835和P.863.2标准衡量语音信号质量,涉及整个通信链路处理,高度还原实时音频通讯(RTC)中的真实挑战。吴志勇团队从数据驱动的角度出发,设计了一套能够有效模拟实时音频通讯中语音损伤的数据仿真链路,并以此构造了一套适配于语音信号质量增强的数据集。在此基础上,团队提出了一个两阶段处理系统,首先进行语音损失修复,而后进行噪声抑制。该两阶段处理系统在有效提升语音质量问题的同时,还解决了由降噪模型过度抑制导致的消音问题和生成模型生成语音中的伪影问题。团队以仿真数据集上训练的两阶段处理系统作为最后的参赛系统,最终在比赛的两个赛道均获得冠军。

本次参赛作品是智能语音交互的重要组成部分,将为智能语音交互中的语音信号质量增强提供技术支撑。相关成果可以进一步完善语音信号质量增强的理论研究基础,并在智能语音交互的多个下游任务中发挥重要的作用。

 


文:陈鋆

编辑:叶思佳

审核:林洲璐