[1]

Z. Zhang, M. Duan, Y. Ye, and H. R. Zhang, “Scalable Multi-Objective and Meta Reinforcement Learning via Gradient Estimation”, AAAI, vol. 40, no. 34, pp. 28609–28617, Mar. 2026.