Huang, H.-H. (2026) “Democratizing LLM Efficiency: From Hyperscale Optimizations to Universal Deployability”, Proceedings of the AAAI Conference on Artificial Intelligence, 40(46), pp. 39707–39714. doi: 10.1609/aaai.v40i46.41324.