Wang, Zihan, Rui Zhang, Hongwei Li, Wenshu Fan, Wenbo Jiang, Qingchuan Zhao, and Guowen Xu. “ConfGuard: A Simple and Effective Backdoor Detection for Large Language Models”. Proceedings of the AAAI Conference on Artificial Intelligence 40, no. 42 (March 14, 2026): 35829–35837. Accessed May 27, 2026. https://ojs.aaai.org/index.php/AAAI/article/view/40897.