[1]

A. J. Singh, A. Kumar, and H. C. Lau, “Learning and Exploiting Shaped Reward Models for Large Scale Multiagent RL”, ICAPS, vol. 31, no. 1, pp. 588-596, May 2021.