Feng J, Feng M, Song H, Zhou W, Li H. SUF: Stabilized Unconstrained Fine-Tuning for Offline-to-Online Reinforcement Learning. AAAI [Internet]. 2024 Mar. 24 [cited 2026 Jul. 26];38(11):11961-9. Available from: https://ojs.aaai.org/index.php/AAAI/article/view/29083