[1]

Z. Zou, J. Wang, Y. Huang, and J. Wu, “Multi-Agent Pointer Transformer: Seq-to-Seq Reinforcement Learning for Multi-Vehicle Dynamic Pickup-Delivery Problems”, AAAI, vol. 40, no. 19, pp. 16593–16601, Mar. 2026.