[1]

S. Gu, “Balance Reward and Safety Optimization for Safe Reinforcement Learning: A Perspective of Gradient Manipulation”, AAAI, vol. 38, no. 19, pp. 21099-21106, Mar. 2024.