Efroni, Y., Merlis, N., & Mannor, S. (2021). Reinforcement Learning with Trajectory Feedback. Proceedings of the AAAI Conference on Artificial Intelligence, 35(8), 7288–7295. https://doi.org/10.1609/aaai.v35i8.16895