[1]

Yan, R. et al. 2023. Video-Text Pre-training with Learned Regions for Retrieval. Proceedings of the AAAI Conference on Artificial Intelligence. 37, 3 (Jun. 2023), 3100–3108. DOI:https://doi.org/10.1609/aaai.v37i3.25414.