(1)

Li, J.; Wang, J.; Tan, M.; Wang, H.; Yan, C.; Shi, L.; Cai, J.; Jiang, X.; Hu, Y. CrossVid: A Comprehensive Benchmark for Evaluating Cross-Video Reasoning in Multimodal Large Language Models. AAAI 2026, 40, 6244-6252.