Burnwal, R., Bhatt, N. P., & Ravindran, B. (2026). SafeMIL: Learning Offline Safe Imitation Policy from Non-Preferred Trajectories. Proceedings of the AAAI Conference on Artificial Intelligence, 40(24), 19790-19798. https://doi.org/10.1609/aaai.v40i24.39061