[1]

F. Bai, H. Zhang, T. Tao, Z. Wu, Y. Wang, and B. Xu, “PiCor: Multi-Task Deep Reinforcement Learning with Policy Correction”, AAAI, vol. 37, no. 6, pp. 6728-6736, Jun. 2023.