[1]

Y. Zhao, Z. Wang, and Z. Huang, “Automatic Curriculum Learning With Over-repetition Penalty for Dialogue Policy Learning”, AAAI, vol. 35, no. 16, pp. 14540-14548, May 2021.