Tran-Thanh, L. (2010) “Epsilon–First Policies for Budget–Limited Multi-Armed Bandits”, Proceedings of the AAAI Conference on Artificial Intelligence, 24(1), pp. 1211–1216. doi: 10.1609/aaai.v24i1.7758.