[1]

H. Zhang, J. Shao, Y. Jiang, S. He, G. Zhang, and X. Ji, “State Deviation Correction for Offline Reinforcement Learning”, AAAI, vol. 36, no. 8, pp. 9022–9030, Jun. 2022.