(1)

He, S.; Yu, C.; Lin, Q.; Liang, Y.; Li, D.; Ding, X. Reliability-Guaranteed and Reward-Seeking Sequence Modeling for Model-Based Offline Reinforcement Learning. AAAI 2026, 40, 21654-21662.