Mu, Ronghui, Leandro Soriano Marcolino, Yanghao Zhang, Tianle Zhang, Xiaowei Huang, and Wenjie Ruan. “Reward Certification for Policy Smoothed Reinforcement Learning”. Proceedings of the AAAI Conference on Artificial Intelligence 38, no. 19 (March 24, 2024): 21429–21437. Accessed May 28, 2026. https://ojs.aaai.org/index.php/AAAI/article/view/30139.