Zou, Z., Wang, J., Huang, Y., & Wu, J. (2026). Multi-Agent Pointer Transformer: Seq-to-Seq Reinforcement Learning for Multi-Vehicle Dynamic Pickup-Delivery Problems. Proceedings of the AAAI Conference on Artificial Intelligence, 40(19), 16593–16601. https://doi.org/10.1609/aaai.v40i19.38700