Burnwal R, Bhatt NP, Ravindran B. SafeMIL: Learning Offline Safe Imitation Policy from Non-Preferred Trajectories. AAAI [Internet]. 2026Mar.14 [cited 2026Apr.28];40(24):19790-8. Available from: https://ojs.aaai.org/index.php/AAAI/article/view/39061