(1)

Xiong, H.; Xu, T.; Liang, Y.; Zhang, W. . Non-Asymptotic Convergence of Adam-Type Reinforcement Learning Algorithms under Markovian Sampling. AAAI 2021, 35, 10460-10468.