Xie, Yin, Kaicheng Yang, Peirou Liang, Xiang An, Yongle Zhao, Yumeng Wang, Ziyong Feng, Roy Miles, Ismail Elezi, and Jiankang Deng. “ViCToR: Improving Visual Comprehension via Token Reconstruction for Pretraining LMMs”. Proceedings of the AAAI Conference on Artificial Intelligence 40, no. 32 (March 14, 2026): 27099–27107. Accessed May 27, 2026. https://ojs.aaai.org/index.php/AAAI/article/view/39924.