Huang, H.-H. (2026). Democratizing LLM Efficiency: From Hyperscale Optimizations to Universal Deployability. Proceedings of the AAAI Conference on Artificial Intelligence, 40(46), 39707–39714. https://doi.org/10.1609/aaai.v40i46.41324