Zhao, P. (2025) “Multimodal Class-aware Semantic Enhancement Network for Audio-Visual Video Parsing”, Proceedings of the AAAI Conference on Artificial Intelligence, 39(10), pp. 10448–10456. doi: 10.1609/aaai.v39i10.33134.