(1)

Hou, J.; Dou, H.; Dang, L.; Chen, L.; Ge, C. Gradient-Protected Value Decomposition for Cooperative Multi-Agent Reinforcement Learning. AAAI 2026, 40, 21779-21787.