Vyas, Sanyam, Alberto Caron, Chris Hicks, Pete Burnap, and Vasilios Mavroudis. “Beyond Training-Time Poisoning: Component-Level and Post-Training Backdoors in Deep Reinforcement Learning”. Proceedings of the AAAI Conference on Artificial Intelligence 40, no. 31 (March 14, 2026): 26072–26080. Accessed May 7, 2026. https://ojs.aaai.org/index.php/AAAI/article/view/39809.