Yuan, Dingbo, Yipeng Chen, Guodong Liu, Chenchen Li, Chengfu Tang, Dongxu Zhang, Zhenkui Wang, Xudong Wang, and Song Liu. “DMT-RoleBench: A Dynamic Multi-Turn Dialogue Based Benchmark for Role-Playing Evaluation of Large Language Model and Agent”. Proceedings of the AAAI Conference on Artificial Intelligence 39, no. 24 (April 11, 2025): 25760–25768. Accessed May 13, 2026. https://ojs.aaai.org/index.php/AAAI/article/view/34768.