Regan, Kevin, and Craig Boutilier. “Robust Policy Computation in Reward-Uncertain MDPs Using Nondominated Policies”. Proceedings of the AAAI Conference on Artificial Intelligence 24, no. 1 (July 4, 2010): 1127–1133. Accessed May 21, 2026. https://ojs.aaai.org/index.php/AAAI/article/view/7740.