[1]

L. Pan, “Towards Robust, Efficient, and Practical Decision-Making: From Reward-Maximizing Deep Reinforcement Learning to Reward-Matching GFlowNets”, AAAI, vol. 39, no. 27, pp. 28724–28724, Apr. 2025.