Huang, Changxin, Lv Tang, Zhaohuan Zhan, Lisha Yu, Runhao Zeng, Zun Liu, Zhengjie Wang, and Jianqiang Li. 2026. “UNeMo: Collaborative Visual-Language Reasoning and Navigation via a Multimodal World Model”. Proceedings of the AAAI Conference on Artificial Intelligence 40 (22):18315-23. https://doi.org/10.1609/aaai.v40i22.38895.