[1]

Z. Ding, Z. Tan, J. Zhang, and T. Chen, “OR-R1: Automating Modeling and Solving of Operations Research Optimization Problem via Test-Time Reinforcement Learning”, AAAI, vol. 40, no. 1, pp. 228–236, Mar. 2026.