Liu, Z., Tu, J., Hong, Y., Xiong, L., Jin, Y., Tang, Y. and Li, F. (2026) “HCPO: Hierarchical Conductor-Based Policy Optimization in Multi-Agent Reinforcement Learning”, Proceedings of the AAAI Conference on Artificial Intelligence, 40(35), pp. 29564-29572. doi: 10.1609/aaai.v40i35.40199.