Ji S, Wang Z, Yu J, Yang X, Li S, Wu S, et al. Diff-V2M: A Hierarchical Conditional Diffusion Model with Explicit Rhythmic Modeling for Video-to-Music Generation. AAAI [Internet]. 2026 Mar. 14 [cited 2026 May 17];40(26):22219-27. Available from: https://ojs.aaai.org/index.php/AAAI/article/view/39378