[1]

S. Zhang, B. Liu, and S. Whiteson, “Mean-Variance Policy Iteration for Risk-Averse Reinforcement Learning”, AAAI, vol. 35, no. 12, pp. 10905-10913, May 2021.