[1]

H. Zeng, “Lethe: Layer- and Time-Adaptive KV Cache Pruning for Reasoning-Intensive LLM Serving”, AAAI, vol. 40, no. 33, pp. 28103–28112, Mar. 2026.