Chen J, Li H, Tang Z, Li X, Wu W, Liu S. AerialVLA: A Vision-Language-Action Model for Aerial Navigation with Online Dialogue. AAAI [Internet]. 2026 Mar. 14 [cited 2026 May 8];40(22):18161-9. Available from: https://ojs.aaai.org/index.php/AAAI/article/view/38878