(1)

Chen, W.; Tian, J.; Fan, C.; Li, Y.; He, H.; Jin, Y. Preference-Controlled Multi-Objective Reinforcement Learning for Conditional Text Generation. AAAI 2023, 37, 12662-12672.