[1]

Y. Fan, Y. Hong, Q. Wang, J. Bao, H. Jiang, and Y. Song, “Preference-Oriented Supervised Fine-Tuning: Favoring Target Model over Aligned Large Language Models”, AAAI, vol. 39, no. 22, pp. 23859-23867, Apr. 2025.