(1)

Dabney, W.; Barreto, A.; Rowland, M.; Dadashi, R.; Quan, J.; G. Bellemare, M.; Silver, D. The Value-Improvement Path: Towards Better Representations for Reinforcement Learning. AAAI 2021, 35, 7160-7168.