Li, Weichen, Waleed Mustafa, Marcio Monteiro, Puyu Wang, Marius Kloft, and Sophie Fellenz. 2026. “TORA: Train Once, Realign Anytime for Offline Multi-Objective Reinforcement Learning”. Proceedings of the AAAI Conference on Artificial Intelligence 40 (44):37609-17. https://doi.org/10.1609/aaai.v40i44.41095.