Gu, Ziyin, Jingyao Wang, Ran Zuo, Chuxiong Sun, Zeen Song, Changwen Zheng, and Wenwen Qiang. 2026. “Group Causal Policy Optimization for Post-Training Large Language Models”. Proceedings of the AAAI Conference on Artificial Intelligence 40 (36):30834-42. https://doi.org/10.1609/aaai.v40i36.40341.