[1]

Q. Zhou, H. Li, and J. Wang, “Deep Model-Based Reinforcement Learning via Estimated Uncertainty and Conservative Policy Optimization”, AAAI, vol. 34, no. 04, pp. 6941-6948, Apr. 2020.