Gong, Z., Kumar, A., & Varakantham, P. (2025). Offline Safe Reinforcement Learning Using Trajectory Classification. Proceedings of the AAAI Conference on Artificial Intelligence, 39(16), 16880–16887. https://doi.org/10.1609/aaai.v39i16.33855