He, Shenghong, Chao Yu, Qian Lin, Yile Liang, Donghui Li, and Xuetao Ding. 2026. “Reliability-Guaranteed and Reward-Seeking Sequence Modeling for Model-Based Offline Reinforcement Learning”. Proceedings of the AAAI Conference on Artificial Intelligence 40 (26):21654-62. https://doi.org/10.1609/aaai.v40i26.39315.