[1]

M. Mutti, L. Pratissoli, and M. Restelli, “Task-Agnostic Exploration via Policy Gradient of a Non-Parametric State Entropy Estimate”, AAAI, vol. 35, no. 10, pp. 9028-9036, May 2021.