[1]

M. Wang, H. Pi, R. Li, Y. Qin, Z. Tang, and K. Li, “VLScene: Vision-Language Guidance Distillation for Camera-Based 3D Semantic Scene Completion”, AAAI, vol. 39, no. 8, pp. 7808–7816, Apr. 2025.