Lou, X. (2025) “Sequential Preference Optimization: Multi-Dimensional Preference Alignment with Implicit Reward Modeling”, Proceedings of the AAAI Conference on Artificial Intelligence, 39(26), pp. 27509–27517. doi: 10.1609/aaai.v39i26.34963.