(1)

Saleh, A.; Jaques, N.; Ghandeharioun, A.; Shen, J.; Picard, R. Hierarchical Reinforcement Learning for Open-Domain Dialog. AAAI 2020, 34, 8741-8748.