Yang, Shangdong, et al. “Efficient Average Reward Reinforcement Learning Using Constant Shifting Values”. Proceedings of the AAAI Conference on Artificial Intelligence, vol. 30, no. 1, Mar. 2016, doi:10.1609/aaai.v30i1.10285.