[1]

J. Yao, “Incorporating Self-Rewriting into Large Language Model Reasoning Reinforcement”, AAAI, vol. 40, no. 40, pp. 34405–34413, Mar. 2026.