Chen, W., Niu, J., Liu, X., Wang, Z., Tang, S., & Zhu, G. (2025). DiffDVC: Accurate Event Detection for Dense Video Captioning via Diffusion Models. Proceedings of the AAAI Conference on Artificial Intelligence, 39(2), 2221–2229. https://doi.org/10.1609/aaai.v39i2.32221