Zhang, Yinmin, Jie Liu, Chuming Li, Yazhe Niu, Yaodong Yang, Yu Liu, and Wanli Ouyang. 2024. “A Perspective of Q-Value Estimation on Offline-to-Online Reinforcement Learning”. Proceedings of the AAAI Conference on Artificial Intelligence 38 (15):16908-16. https://doi.org/10.1609/aaai.v38i15.29633.