(1)

Li, J.; Ren, T.; Yan, D.; Su, H.; Zhu, J. Policy Learning for Robust Markov Decision Process With a Mismatched Generative Model. AAAI 2022, 36, 7417-7425.