Li, Bingliang, Fengyu Yang, Yuxin Mao, Qingwen Ye, Hongkai Chen, and Yiran Zhong. 2025. “Tri-Ergon: Fine-Grained Video-to-Audio Generation With Multi-Modal Conditions and LUFS Control”. Proceedings of the AAAI Conference on Artificial Intelligence 39 (5):4616-24. https://doi.org/10.1609/aaai.v39i5.32487.