[1]

N. Kunananthaseelan, J. Zhang, and M. Harandi, “LaViP: Language-Grounded Visual Prompting”, AAAI, vol. 38, no. 3, pp. 2840–2848, Mar. 2024.