[1]

Z. Wang, J. Wang, Q. Zhou, B. Li, and H. Li, “Sample-Efficient Reinforcement Learning via Conservative Model-Based Actor-Critic”, AAAI, vol. 36, no. 8, pp. 8612-8620, Jun. 2022.