[1]

J. Lei, Z. Fan, Y. Zhang, W. Xie, Y. Zhang, and Y. Wang, “Versatile Vision-Language Model for 3D Computed Tomography”, AAAI, vol. 40, no. 8, pp. 5945–5954, Mar. 2026.