(1)

Weng, P. Markov Decision Processes With Ordinal Rewards: Reference Point-Based Preferences. ICAPS 2011, 21, 282-289.