[1]

J. Nöther, A. Singla, and G. Radanovic, “Text-Diffusion Red-Teaming of Large Language Models: Unveiling Harmful Behaviors with Proximity Constraints”, AAAI, vol. 39, no. 26, pp. 27547–27555, Apr. 2025.