(1)

Zhang, H.; Shao, J.; Jiang, Y.; He, S.; Zhang, G.; Ji, X. State Deviation Correction for Offline Reinforcement Learning. AAAI 2022, 36, 9022-9030.