(1)

Infante, G.; Jonsson, A.; Gómez, V. Globally Optimal Hierarchical Reinforcement Learning for Linearly-Solvable Markov Decision Processes. AAAI 2022, 36, 6970-6977.