Zheng, H., Luo, X., Wei, P., Song, X., Li, D., & Jiang, J. (2023). Adaptive Policy Learning for Offline-to-Online Reinforcement Learning. Proceedings of the AAAI Conference on Artificial Intelligence, 37(9), 11372-11380. https://doi.org/10.1609/aaai.v37i9.26345