[1]

J. Xu, “Thinker: Training LLMs in Hierarchical Thinking for Deep Search via Multi-Turn Interaction”, AAAI, vol. 40, no. 40, pp. 34142–34150, Mar. 2026.