Ren, T., Wang, H., & Rafferty, K. (2025). Enhancing Question Generation through Diversity-Seeking Reinforcement Learning with Bilevel Policy Decomposition. Proceedings of the AAAI Conference on Artificial Intelligence, 39(23), 25083–25091. https://doi.org/10.1609/aaai.v39i23.34693