[1]

Y. Ding, M. Jin, and J. Lavaei, “Non-stationary Risk-Sensitive Reinforcement Learning: Near-Optimal Dynamic Regret, Adaptive Detection, and Separation Design”, AAAI, vol. 37, no. 6, pp. 7405-7413, Jun. 2023.