Cheng, Zihui, Qiguang Chen, Jin Zhang, Hao Fei, Xiaocheng Feng, Wanxiang Che, Min Li, and Libo Qin. 2025. “CoMT: A Novel Benchmark for Chain of Multi-Modal Thought on Large Vision-Language Models”. Proceedings of the AAAI Conference on Artificial Intelligence 39 (22):23678-86. https://doi.org/10.1609/aaai.v39i22.34538.