[1]

Regan, K. and Boutilier, C. 2010. Robust Policy Computation in Reward-Uncertain MDPs Using Nondominated Policies. Proceedings of the AAAI Conference on Artificial Intelligence. 24, 1 (Jul. 2010), 1127–1133. DOI:https://doi.org/10.1609/aaai.v24i1.7740.