He S, Yu C, Lin Q, Liang Y, Li D, Ding X. Reliability-Guaranteed and Reward-Seeking Sequence Modeling for Model-Based Offline Reinforcement Learning. AAAI [Internet]. 2026 Mar. 14 [cited 2026 May 14];40(26):21654-62. Available from: https://ojs.aaai.org/index.php/AAAI/article/view/39315