[1]

T. Brázdil, K. Chatterjee, P. Novotný, and J. Vahala, “Reinforcement Learning of Risk-Constrained Policies in Markov Decision Processes”, AAAI, vol. 34, no. 06, pp. 9794-9801, Apr. 2020.