[1]

Y. Liu, L. Xu, P. Xiong, and Q. Jin, “Token Mixing: Parameter-Efficient Transfer Learning from Image-Language to Video-Language”, AAAI, vol. 37, no. 2, pp. 1781–1789, Jun. 2023.