(1)

Zhou, Q.; Li, H.; Wang, J. Deep Model-Based Reinforcement Learning via Estimated Uncertainty and Conservative Policy Optimization. AAAI 2020, 34, 6941-6948.