[1]

T. Zhu, Y. Qiu, H. Zhou, and J. Li, “Decoding Global Preferences: Temporal and Cooperative Dependency Modeling in Multi-Agent Preference-Based Reinforcement Learning”, AAAI, vol. 38, no. 15, pp. 17202-17210, Mar. 2024.