Fan, Yuchen, Yuzhong Hong, Qiushi Wang, Junwei Bao, Hongfei Jiang, and Yang Song. “Preference-Oriented Supervised Fine-Tuning: Favoring Target Model over Aligned Large Language Models”. Proceedings of the AAAI Conference on Artificial Intelligence 39, no. 22 (April 11, 2025): 23859-23867. Accessed April 27, 2026. https://ojs.aaai.org/index.php/AAAI/article/view/34558.