(1)

Hung, Y.-H.; Hsieh, P.-C.; Liu, X.; Kumar, P. R. Reward-Biased Maximum Likelihood Estimation for Linear Stochastic Bandits. AAAI 2021, 35, 7874-7882.