Lu S, Zhang K, Chen T, Başar T, Horesh L. Decentralized Policy Gradient Descent Ascent for Safe Multi-Agent Reinforcement Learning. AAAI [Internet]. 2021 May 18 [cited 2026 May 26];35(10):8767-75. Available from: https://ojs.aaai.org/index.php/AAAI/article/view/17062