Zhou, Pengfei, Xiaopeng Peng, Fanrui Zhang, Zhaopan Xu, Jiaxin Ai, Yansheng Qiu, Wangbo Zhao, Jiajun Song, Chuanhao Li, Weidong Tang, Zhen Li, Haoquan Zhang, Zizhen Li, Xiaofeng Mao, Yukang Feng, Jianwen Sun, Kai Wang, Xiaojun Chang, Wenqi Shao, Yang You, and Kaipeng Zhang. “MDK12-Bench: A Multi-Discipline Benchmark for Evaluating Reasoning in Multimodal Large Language Models”. Proceedings of the AAAI Conference on Artificial Intelligence 40, no. 34 (March 14, 2026): 28982-28990. Accessed May 3, 2026. https://ojs.aaai.org/index.php/AAAI/article/view/40134.