Wang Z, Tu H, Wang Y, Wu J, Liu Y, Mei J, et al. STAR-1: Safer Alignment of Reasoning LLMs with 1K Data. AAAI [Internet]. 2026 Mar. 14 [cited 2026 Jul. 14];40(44):37988-97. Available from: https://ojs.aaai.org/index.php/AAAI/article/view/41136