近日,以“绿动算力 超智融合”为主题的第21届全国高性能计算学术大会(HPC China 2025)在鄂尔多斯市举行。会上,大赛组委会揭晓了第十二届全国并行应用挑战赛(Parallel Application Challenge,简称PAC2025)的比赛结果。
由清华大学深圳国际研究生院计算机科学与技术专业2025级博士生许蕴朴、计算机技术专业2025级硕士生吴羲勇、数据科学与信息技术专业2024级硕士生谭雄川和清华大学地学系2022级博士生张金潇组成的团队,凭借项目“面向新一代国产CPU架构的生成式基础模型DiT训推优化”斩获PAC应用赛道特等奖。指导老师为清华大学深圳国际研究生院付昊桓教授。
应用赛道特等奖领奖现场
(左二:张金潇、左三:许蕴朴、左四:吴羲勇)
我院团队聚焦新一代国产鲲鹏CPU架构的特性,从算子适配、通信优化到内存管理等多角度开展体系结构优化与创新,实现了DiT模型国产CPU平台上的大规模高效并行训练,实现与GPU相当的端到端训练性能,支持超大Batch训练且收敛稳定。依托国产CPU的硬件优势,团队为“数值算法+AI”耦合应用提供了坚实支撑。该成果不仅展示了国产CPU在生成式模型训练中的可行性,也为人工智能任务在国产平台的落地应用奠定了实践基础。
此外,该团队针对鲲鹏架构设计的高性能INT8矩阵乘和Attention算子优化成果还荣获本次赛事优化赛道二等奖。
优化赛道二等奖领奖现场
(右三:许蕴朴、右二:吴羲勇)
PAC是国内并行计算领域最具影响力的赛事之一,始终致力于推动高性能计算技术的应用与人才培养。本届大赛吸引了来自全国高校、科研院所和产业界的200余支队伍参赛。应用赛道聚焦真实需求,让国产CPU直面工程难题;优化赛道从底层硬件到高层算法全栈拿捏,不断突破性能极限。
依托清华大学的深厚底蕴和深圳的创新基因,清华大学深圳国际研究生院坚持跨学科融合、国际化培养和产学研协同的育人模式,在国产算力快速发展的背景下,积极将青年学生引入国产算力研发与人工智能创新的前沿阵地,让学生们在大模型训练、科学计算、产业落地等真实挑战中锤炼本领、开阔视野、厚植家国情怀。
此次获奖不仅体现了我院以国家战略和产业需求为牵引、扎根深圳创新沃土实践产学研协同育人的鲜明特色,也彰显了我院在国产“超算及智算”领域的深厚基础,更是国产算力支撑人工智能创新和人才培养的突破性探索。
文:张金潇
图:CCF HPC China
编辑:林洲璐
审核:聂晓梅