[1]

M. Meng, Z. Tan, Y. Zhang, and X. Zhou, “Appearance-Motion Decomposed Alignment for Text-Video Retrieval”, AAAI, vol. 40, no. 10, pp. 7999-8007, Mar. 2026.