Zhao P, Zhou J, Zhao Y, Guo D, Chen Y. Multimodal Class-aware Semantic Enhancement Network for Audio-Visual Video Parsing. AAAI [Internet]. 2025 Apr. 11 [cited 2026 May 16];39(10):10448-56. Available from: https://ojs.aaai.org/index.php/AAAI/article/view/33134