(1)

Bao, R.; Wang, B.; Wang, X.; Li, H.; Zheng, R.; Rutkowski, L.; Zhang, Q.; Ding, L.; Tao, D. Time-Frequency Token Advantage Clipping for Training Efficient Large Reasoning Model. AAAI 2026, 40, 30049-30057.