(1)

Chen, G.; Liew, S. C.; Gündüz, D. GINO-Q: Learning an Asymptotically Optimal Index Policy for Restless Multi-Armed Bandits. AAAI 2026, 40, 20032-20040.