[1]

K. Regan and C. Boutilier, “Robust Policy Computation in Reward-Uncertain MDPs Using Nondominated Policies”, AAAI, vol. 24, no. 1, pp. 1127–1133, Jul. 2010.