Li, C., and J. Flanigan. “Task Contamination: Language Models May Not Be Few-Shot Anymore”. Proceedings of the AAAI Conference on Artificial Intelligence, vol. 38, no. 16, Mar. 2024, pp. 18471-80, doi:10.1609/aaai.v38i16.29808.