[1]

K. Wang, “Reinforcement Learning with a Disentangled Universal Value Function for Item Recommendation”, AAAI, vol. 35, no. 5, pp. 4427-4435, May 2021.