(1)

Lu, Z.; Geng, T.; Chen, Y.; Wang, T.; Lu, P.; Zheng, F. R-AVST: Empowering Video-LLMs With Fine-Grained Spatio-Temporal Reasoning in Complex Audio-Visual Scenarios. AAAI 2026, 40, 7627-7635.