于超,2023年博士毕业于清华大学电子工程系,现任清华大学深圳国际研究生院助理教授(特聘研究员),入选中国电子学会青年人才托举工程。长期从事基于强化学习的决策智能研究。以第一作者或通讯作者在ICML、NeurIPS、ICLR、CVPR、ECCV、CoRL、IROS、ICRA、TMLR、RAL等国际高水平会议与期刊发表论文50余篇,谷歌学术引用超过5500次。代表性成果包括多智能体强化学习算法MAPPO(谷歌学术引用超2800次)、以及面向具身智能的大规模强化学习训练框架RLinf(GitHub Star超2600)。






