[1]

Ding, Z. et al. 2026. OR-R1: Automating Modeling and Solving of Operations Research Optimization Problem via Test-Time Reinforcement Learning. Proceedings of the AAAI Conference on Artificial Intelligence. 40, 1 (Mar. 2026), 228–236. DOI:https://doi.org/10.1609/aaai.v40i1.36983.