[1]

Y. Cai, Y. Yuan, J. Shi, and Q. Lin, “Approximated Variational Bayesian Inverse Reinforcement Learning for Large Language Model Alignment”, AAAI, vol. 39, no. 22, pp. 23505-23513, Apr. 2025.