[1]

H. Zhou, S. Li, T. Chen, Q. Song, C. Gao, and J. Li, “Towards Long-window Anchoring in Vision-Language Model Distillation”, AAAI, vol. 40, no. 34, pp. 28955–28963, Mar. 2026.