Regan, K., & Boutilier, C. (2010). Robust Policy Computation in Reward-Uncertain MDPs Using Nondominated Policies. Proceedings of the AAAI Conference on Artificial Intelligence, 24(1), 1127–1133. https://doi.org/10.1609/aaai.v24i1.7740