王晓智助理教授的研究领域为大语言模型、自然语言处理和知识工程,主要研究兴趣包括:
• 大模型机理可解释性:理解大模型内部工作机理,为模型行为提供解释的同时探索其形成智能的科学原理。
• 机理指导的大模型改进:基于工作机理和内部指征改进大模型架构、训练和评测,如探索稀疏激活架构、内部状态指导的数据筛选和模型评测等,从而基础性地提升大模型系统的知识、效率、安全性和自主性。
他还从事过知识获取和知识赋能大模型方向的研究。在这些方向上,他的代表性成果包括大模型技能神经元定位技术、大模型知识理解能力综合评测体系和增强技术等。他于ACL、EMNLP、ICLR 等国际顶级学术会议、期刊以(共同)第一作者身份发表论文十余篇,并获得3项国家发明专利授权。他的谷歌学术引用超过4400 次,研究成果获得ESI高被引论文、EMNLP 杰出论文奖等荣誉。