Li, J., Wang, J., Tan, M., Wang, H., Yan, C., Shi, L., … Hu, Y. (2026). CrossVid: A Comprehensive Benchmark for Evaluating Cross-Video Reasoning in Multimodal Large Language Models. Proceedings of the AAAI Conference on Artificial Intelligence, 40(8), 6244–6252. https://doi.org/10.1609/aaai.v40i8.37550