Fang X, Liu D, Fang W, Zhou P, Xu Z, Xu W, et al. Fewer Steps, Better Performance: Efficient Cross-Modal Clip Trimming for Video Moment Retrieval Using Language. AAAI [Internet]. 2024 Mar. 24 [cited 2026 May 14];38(2):1735-43. Available from: https://ojs.aaai.org/index.php/AAAI/article/view/27941