[1]

J. Dai, J. Ji, L. Yang, Q. Zheng, and G. Pan, “Augmented Proximal Policy Optimization for Safe Reinforcement Learning”, AAAI, vol. 37, no. 6, pp. 7288–7295, Jun. 2023.