[1]

Burnwal, R., Bhatt, N.P. and Ravindran, B. 2026. SafeMIL: Learning Offline Safe Imitation Policy from Non-Preferred Trajectories. Proceedings of the AAAI Conference on Artificial Intelligence. 40, 24 (Mar. 2026), 19790-19798. DOI:https://doi.org/10.1609/aaai.v40i24.39061.