[1]

R. Burnwal, N. P. Bhatt, and B. Ravindran, “SafeMIL: Learning Offline Safe Imitation Policy from Non-Preferred Trajectories”, AAAI, vol. 40, no. 24, pp. 19790–19798, Mar. 2026.