Zhu T, Qiu Y, Zhou H, Li J. Decoding Global Preferences: Temporal and Cooperative Dependency Modeling in Multi-Agent Preference-Based Reinforcement Learning. AAAI [Internet]. 2024 Mar. 24 [cited 2026 May 9];38(15):17202-10. Available from: https://ojs.aaai.org/index.php/AAAI/article/view/29666