[1]

L. Li, Q. Li, B. Zhang, and X. Chu, “Norm Tweaking: High-Performance Low-Bit Quantization of Large Language Models”, AAAI, vol. 38, no. 17, pp. 18536-18544, Mar. 2024.