Zhao, S., Cui, W., Jiang, B., Kong, L., & Yan, X. (2024). Responsible Bandit Learning via Privacy-Protected Mean-Volatility Utility. Proceedings of the AAAI Conference on Artificial Intelligence, 38(19), 21815-21822. https://doi.org/10.1609/aaai.v38i19.30182