[1]

R. Stolz, M. Eichelbeck, and M. Althoff, “Improving Stochastic Action-Constrained Reinforcement Learning via Truncated Distributions”, AAAI, vol. 40, no. 30, pp. 25617–25626, Mar. 2026.