Li Y, Liu M, Li Z, Bian Y, Wang X, Zhai E, et al. Mono3DVG-EnSD: Enhanced Spatial-aware and Dimension-decoupled Text Encoding for Monocular 3D Visual Grounding. AAAI [Internet]. 2026 Mar. 14 [cited 2026 May 15];40(8):6726-34. Available from: https://ojs.aaai.org/index.php/AAAI/article/view/37604