[1]

Y. Jiang, S. Bharadwaj, B. Wu, R. Shah, U. Topcu, and P. Stone, “Temporal-Logic-Based Reward Shaping for Continuing Reinforcement Learning Tasks”, AAAI, vol. 35, no. 9, pp. 7995–8003, May 2021.