(1)

Li, H.; Zhou, H.; Zou, Y.; Yu, D.; Lan, T. ConcaveQ: Non-Monotonic Value Function Factorization via Concave Representations in Deep Multi-Agent Reinforcement Learning. AAAI 2024, 38, 17461-17468.