Lu S, Zhang K, Chen T, Başar T, Horesh L. Decentralized Policy Gradient Descent Ascent for Safe Multi-Agent Reinforcement Learning. AAAI [Internet]. 2021May18 [cited 2024May11];35(10):8767-75. Available from: https://ojs.aaai.org/index.php/AAAI/article/view/17062