Zhang, Junyu, Amrit Singh Bedi, Mengdi Wang, and Alec Koppel. “Multi-Agent Reinforcement Learning With General Utilities via Decentralized Shadow Reward Actor-Critic”. Proceedings of the AAAI Conference on Artificial Intelligence 36, no. 8 (June 28, 2022): 9031–9039. Accessed May 26, 2026. https://ojs.aaai.org/index.php/AAAI/article/view/20887.