(1)

Wei, W.; Zhang, Y.; Liang, J.; Li, L.; Li, Y. Controlling Underestimation Bias in Reinforcement Learning via Quasi-Median Operation. AAAI 2022, 36, 8621-8628.