(1)

Huang, C.; Tang, L.; Zhan, Z.; Yu, L.; Zeng, R.; Liu, Z.; Wang, Z.; Li, J. UNeMo: Collaborative Visual-Language Reasoning and Navigation via a Multimodal World Model. AAAI 2026, 40, 18315-18323.