[1]

Rang, M. et al. 2025. Eve: Efficient Multimodal Vision Language Models with Elastic Visual Experts. Proceedings of the AAAI Conference on Artificial Intelligence. 39, 7 (Apr. 2025), 6694–6702. DOI:https://doi.org/10.1609/aaai.v39i7.32718.