(1)

Zhang, T.-H.; Zhang, J.; Wang, J.; Qian, X.; Yin, X.-C. FaceSpeak: Expressive and High-Quality Speech Synthesis from Human Portraits of Different Styles. AAAI 2025, 39, 25922-25930.