(1)

Ren, T.; Wang, H.; Rafferty, K. Enhancing Question Generation through Diversity-Seeking Reinforcement Learning With Bilevel Policy Decomposition. AAAI 2025, 39, 25083-25091.