(1)

Chen, J.; Li, H.; Tang, Z.; Li, X.; Wu, W.; Liu, S. AerialVLA: A Vision-Language-Action Model for Aerial Navigation With Online Dialogue. AAAI 2026, 40, 18161-18169.