[1]

Y. Zhang, “Contrastive Spatio-Temporal Pretext Learning for Self-Supervised Video Representation”, AAAI, vol. 36, no. 3, pp. 3380-3389, Jun. 2022.