[1]

C. Tang, “TSPO: Temporal Sampling Policy Optimization for Long-form Video Language Understanding”, AAAI, vol. 40, no. 11, pp. 9368–9376, Mar. 2026.