(1)

Zhao, P.; Zhou, J.; Zhao, Y.; Guo, D.; Chen, Y. Multimodal Class-Aware Semantic Enhancement Network for Audio-Visual Video Parsing. AAAI 2025, 39, 10448-10456.