(1)

Metcalf, K.; Sarabia, M.; Fedzechkina, M.; Theobald, B.-J. Can You Rely on Synthetic Labellers in Preference-Based Reinforcement Learning? It’s Complicated. AAAI 2024, 38, 10128-10136.