[1]

Z. Liu, S. H. Khajavi, G. Jiang, and X. Liu, “Targeting Misalignment: A Conflict-Aware Framework for Reward-Model-based LLM Alignment”, AAAI, vol. 40, no. 44, pp. 37692–37700, Mar. 2026.