[1]

R. Kong, C. Wu, and Z. Zhang, “Generalizable Policy Improvement via Reinforcement Sampling (Student Abstract)”, AAAI, vol. 38, no. 21, pp. 23546–23547, Mar. 2024.