(1)

Xiang, T.; Li, Y.; Liu, L.; Zhi, H.; Chen, C.; Du, Q.; Tan, M. FAM: Fine-Grained Alignment Matters in Multimodal Embedding Learning With Large Vision-Language Models. AAAI 2026, 40, 27046-27054.