Ma, Hao, Shijie Wang, Zhiqiang Pu, Siyao Zhao, and Xiaolin Ai. “Vision-Based Generic Potential Function for Policy Alignment in Multi-Agent Reinforcement Learning”. Proceedings of the AAAI Conference on Artificial Intelligence 39, no. 18 (April 11, 2025): 19287–19295. Accessed May 13, 2026. https://ojs.aaai.org/index.php/AAAI/article/view/34123.