[1]

J. Li, Y. Zhang, J.-F. Hu, C. Tan, T. Liang, and B. Xia, “TubeRMC: Tube-conditioned Reconstruction with Mutual Constraints for Weakly-supervised Spatio-Temporal Video Grounding”, AAAI, vol. 40, no. 8, pp. 6253–6261, Mar. 2026.