[1]

H. Gu, L. Hu, S. Niu, and F. Liu, “FLRQ: Faster LLM Quantization with Flexible Low-Rank Matrix Sketching”, AAAI, vol. 40, no. 26, pp. 21369–21377, Mar. 2026.