Yang, S. (2016) “Efficient Average Reward Reinforcement Learning Using Constant Shifting Values”, Proceedings of the AAAI Conference on Artificial Intelligence, 30(1). doi: 10.1609/aaai.v30i1.10285.