Wang, M., Xing, J., Jiang, B., Chen, J., Mei, J., Zuo, X., … Liu, Y. (2024). A Multimodal, Multi-Task Adapting Framework for Video Action Recognition. Proceedings of the AAAI Conference on Artificial Intelligence, 38(6), 5517–5525. https://doi.org/10.1609/aaai.v38i6.28361