[1]

H. Xiong, T. Xu, Y. Liang, and W. . Zhang, “Non-asymptotic Convergence of Adam-type Reinforcement Learning Algorithms under Markovian Sampling”, AAAI, vol. 35, no. 12, pp. 10460-10468, May 2021.