[1]

Y. Pang, B. Yang, Y. Cao, R. Fan, X. Li, and C. He, “MoCHA: Advanced Vision-Language Reasoning with MoE Connector and Hierarchical Group Attention”, AAAI, vol. 40, no. 29, pp. 24755–24763, Mar. 2026.