(1)

Cai, Y.; Yuan, Y.; Shi, J.; Lin, Q. Approximated Variational Bayesian Inverse Reinforcement Learning for Large Language Model Alignment. AAAI 2025, 39, 23505-23513.