(1)

Ge, S.; Chen, Q.; Jiang, Z.; Yin, Y.; Qin, L.; Chen, Z.; Gu, Q. Implicit Location-Caption Alignment via Complementary Masking for Weakly-Supervised Dense Video Captioning. AAAI 2025, 39, 3113-3121.