(1)
Le, H.; Abdolshah, M.; George, T. K.; Do, K.; Nguyen, D.; Venkatesh, S. Episodic Policy Gradient Training. AAAI 2022, 36, 7317-7325.