MemoVision: A Digital Catalog for Everyday Interactions

Lai Xing Ng; Keith Tien Wei Tang; Jacky Jie Wei Tan

doi:10.1609/aaai.v40i48.42368

MemoVision: A Digital Catalog for Everyday Interactions

Authors

Lai Xing Ng Institute for Infocomm Research, Agency for Science, Technology and Research (A*STAR)
Keith Tien Wei Tang Institute for Infocomm Research, Agency for Science, Technology and Research (A*STAR)
Jacky Jie Wei Tan Institute for Infocomm Research, Agency for Science, Technology and Research (A*STAR)

DOI:

https://doi.org/10.1609/aaai.v40i48.42368

Abstract

We present MemoVision, a digital catalog system that captures semantic, spatial, temporal and interaction information as users move around physical environments using client devices such as smart glasses. The system utilizes open-vocabulary semantic segmentation and 3D scans to store objects-of-interest with comprehensive semantic, spatial, temporal and interaction labels. Our demonstration shows multimodal information query and retrieval capabilities, supporting specific queries about object locations, temporal events and user interactions including eye gaze and hand poses, enabling more contextualized responses compared to current multimodal large language models.

AAAI-26 / IAAI-26 / EAAI-26 Proceedings Cover

Downloads

Published

2026-03-14

How to Cite

Ng, L. X., Tang, K. T. W., & Tan, J. J. W. (2026). MemoVision: A Digital Catalog for Everyday Interactions. Proceedings of the AAAI Conference on Artificial Intelligence, 40(48), 41646–41648. https://doi.org/10.1609/aaai.v40i48.42368

Download Citation

Issue

Vol. 40 No. 48: EAAI-26 AI for Education, Model AI Assignments, AAAI-26 Emerging Trends, Doctoral Consortium, Student Abstracts, Undergraduate Consortium and Demonstrations

Section

AAAI Demonstration Track

MemoVision: A Digital Catalog for Everyday Interactions

Authors

DOI:

Abstract

Downloads

Published

How to Cite

Issue

Section

Information