Song, Z., Ouyang, G., Li, M., Ji, Y., Wang, C., Xu, Z., Zhang, Z., Zhang, X., Jiang, Q., Ji, F., Chen, Z., Li, Z., & Chen, X. (2026). ManipLVM-R1: Reinforcement Learning for Reasoning in Embodied Manipulation with Large Vision-Language Models. Proceedings of the AAAI Conference on Artificial Intelligence, 40(22), 18558-18566. https://doi.org/10.1609/aaai.v40i22.38922