(1)

Wang, Z.; Wang, J.; Zhou, Q.; Li, B.; Li, H. Sample-Efficient Reinforcement Learning via Conservative Model-Based Actor-Critic. AAAI 2022, 36, 8612-8620.