[1]

R. Wang, Z. Chen, C. Chen, J. Ma, H. Lu, and X. Lin, “Compositional Text-to-Image Synthesis with Attention Map Control of Diffusion Models”, AAAI, vol. 38, no. 6, pp. 5544–5552, Mar. 2024.