Selected Publications

George Pantazopoulos, Eda Bilici Ozyigit (2026). An Efficient Training Pipeline for Reasoning Graphical User Interface Agents. In ICLR MMI Workshop.

Antonia Karamolegkou, Malvina Nikandrou, George Pantazopoulos, Danae Sanchez Villegas, Phillip Rust, Ruchira Dhar, Daniel Hershcovich, Anders Søgaard (2025). Evaluating Multimodal Language Models as Visual Assistants for Visually Impaired Users. In ACL.

PDF Code Dataset

Malvina Nikandrou, George Pantazopoulos, Nikolas Vitsakis, Ioannis Konstas, Alessandro Suglia (2025). CROPE: Evaluating In-Context Adaptation of Vision and Language Models to Culture-Specific Concepts. In NAACL.

PDF Code Dataset

George Pantazopoulos, Malvina Nikandrou, Alessandro Suglia, Oliver Lemon, Arash Eshghi (2024). Shaking Up VLMs: Comparing Transformers and Structured State Space Models for Vision & Language Modeling. In EMNLP.

George Pantazopoulos, Alessandro Suglia, Oliver Lemon, Arash Eshghi (2024). Lost in Space: Probing Fine-grained Spatial Understanding in Vision and Language Resamplers. In NAACL.

Malvina Nikandrou, George Pantazopoulos, Ioannis Konstas, Alessandro Suglia (2024). Enhancing Continual Learning in Visual Question Answering with Modality-Aware Feature Distillation. In ACL ALVR.

George Pantazopoulos, Malvina Nikandrou, Amit Parekh, Bhathiya Hemanthage, Arash Eshghi, Ioannis Konstas, Verena Rieser, Oliver Lemon, Alessandro Suglia (2023). Multitask Multimodal Prompted Training for Interactive Embodied Task Completion. In EMNLP.

PDF Code Project

George Pantazopoulos, Alessandro Suglia, Arash Eshghi (2022). Combine to Describe: Evaluating Compositional Generalization in Image Captioning. In 2022 ACL SRW.