Yang S, Gao Y, An B, Wang H, Chen X. Efficient Average Reward Reinforcement Learning Using Constant Shifting Values. AAAI [Internet]. 2016 Mar. 2 [cited 2026 May 29];30(1). Available from: https://ojs.aaai.org/index.php/AAAI/article/view/10285