Liu, Yu, Yanbing Liu, Fangfang Yuan, Cong Cao, Youbang Sun, Kun Peng, WeiZhuo Chen, Jianjun Li, and Zhiyuan Ma. “OPERA: A Reinforcement Learning--Enhanced Orchestrated Planner-Executor Architecture for Reasoning-Oriented Multi-Hop Retrieval”. Proceedings of the AAAI Conference on Artificial Intelligence 40, no. 38 (March 14, 2026): 32258–32266. Accessed May 19, 2026. https://ojs.aaai.org/index.php/AAAI/article/view/40499.