(1)

Pan, L. Towards Robust, Efficient, and Practical Decision-Making: From Reward-Maximizing Deep Reinforcement Learning to Reward-Matching GFlowNets. AAAI 2025, 39, 28724-28724.