[1]

A. Raghavan, S. Sanner, R. Khardon, P. Tadepalli, and A. Fern, “Hindsight Optimization for Hybrid State and Action MDPs”, AAAI, vol. 31, no. 1, Feb. 2017.