Tran-Thanh, Long, et al. “Epsilon–First Policies for Budget–Limited Multi-Armed Bandits”. Proceedings of the AAAI Conference on Artificial Intelligence, vol. 24, no. 1, July 2010, pp. 1211-6, doi:10.1609/aaai.v24i1.7758.