Liu, Y., Wan, B., Zhu, X., & He, X. (2020). Learning Cross-Modal Context Graph for Visual Grounding. Proceedings of the AAAI Conference on Artificial Intelligence, 34(07), 11645-11652. https://doi.org/10.1609/aaai.v34i07.6833