Meng, GuangHao, Sunan He, Jinpeng Wang, Tao Dai, Letian Zhang, Jieming Zhu, Qing Li, Gang Wang, Rui Zhang, and Yong Jiang. “EvdCLIP: Improving Vision-Language Retrieval With Entity Visual Descriptions from Large Language Models”. Proceedings of the AAAI Conference on Artificial Intelligence 39, no. 6 (April 11, 2025): 6126–6134. Accessed May 28, 2026. https://ojs.aaai.org/index.php/AAAI/article/view/32655.