Wu, Yuexin, Xiujun Li, Jingjing Liu, Jianfeng Gao, and Yiming Yang. 2019. “Switch-Based Active Deep Dyna-Q: Efficient Adaptive Planning for Task-Completion Dialogue Policy Learning”. Proceedings of the AAAI Conference on Artificial Intelligence 33 (01):7289-96. https://doi.org/10.1609/aaai.v33i01.33017289.