[1]

J. Zhang, A. S. Bedi, M. Wang, and A. Koppel, “Multi-Agent Reinforcement Learning with General Utilities via Decentralized Shadow Reward Actor-Critic”, AAAI, vol. 36, no. 8, pp. 9031–9039, Jun. 2022.