[1]

W. Wei, “Thinking Forward and Backward: Multi-Objective Reinforcement Learning for Retrieval-Augmented Reasoning”, AAAI, vol. 40, no. 40, pp. 33836-33844, Mar. 2026.