Guo, Zhifang, Jianguo Mao, Rui Tao, Long Yan, Kazushige Ouchi, Hong Liu, and Xiangdong Wang. “Audio Generation With Multiple Conditional Diffusion Model”. Proceedings of the AAAI Conference on Artificial Intelligence 38, no. 16 (March 24, 2024): 18153-18161. Accessed April 28, 2026. https://ojs.aaai.org/index.php/AAAI/article/view/29773.