[1]

H.-H. Huang, “Democratizing LLM Efficiency: From Hyperscale Optimizations to Universal Deployability”, AAAI, vol. 40, no. 46, pp. 39707–39714, Mar. 2026.