[1]

Yang, C.-C., Fan, W.-C., Yang, C.-F. and Wang, Y.-C.F. 2022. Cross-Modal Mutual Learning for Audio-Visual Speech Recognition and Manipulation. Proceedings of the AAAI Conference on Artificial Intelligence. 36, 3 (Jun. 2022), 3036-3044. DOI:https://doi.org/10.1609/aaai.v36i3.20210.