[1]

J. Hou, H. Dou, L. Dang, L. Chen, and C. Ge, “Gradient-Protected Value Decomposition for Cooperative Multi-Agent Reinforcement Learning”, AAAI, vol. 40, no. 26, pp. 21779–21787, Mar. 2026.