Wang X, Wang D, Ying W, Bai H, Gong N, Dong S, et al. Efficient Post-Training Refinement of Latent Reasoning in Large Language Models. AAAI [Internet]. 2026 Mar. 14 [cited 2026 May 16];40(40):33692-700. Available from: https://ojs.aaai.org/index.php/AAAI/article/view/40659