Chen C-Y, Choi J, Brand D, Agrawal A, Zhang W, Gopalakrishnan K. AdaComp : Adaptive Residual Gradient Compression for Data-Parallel Distributed Training. AAAI [Internet]. 2018Apr.29 [cited 2026May1];32(1). Available from: https://ojs.aaai.org/index.php/AAAI/article/view/11728