Wang Z, Li D, Chen Y, Shi Y, Bai L, Yu T, et al. One-Step Generative Policies with Q-Learning: A Reformulation of MeanFlow. AAAI [Internet]. 2026 Mar. 14 [cited 2026 May 16];40(31):26751-9. Available from: https://ojs.aaai.org/index.php/AAAI/article/view/39885