Zero-Shot Video Moment Retrieval From Frozen Vision-Language Models

Preventing Zero-Shot Transfer Degradation in Continual Learning of Vision-Language ModelsПодробнее

Large Language Models Are Zero Shot ReasonersПодробнее

Zero-Shot Visual Question AnsweringПодробнее

412 - Two-Level Adversarial Visual-Semantic Coupling for Generalized Zero-shot LearningПодробнее

OpenAI's CLIP for Zero Shot Image ClassificationПодробнее

Contextual Emotion Recognition using Large Vision Language ModelsПодробнее

Fast Zero Shot Object Detection with OpenAI CLIPПодробнее

Zero-Shot Building Attribute Extraction From Large-Scale Vision and Language ModelsПодробнее

CVPR #18542 - New Frontiers for Zero-Shot Image Captioning EvaluationПодробнее

OpenAI CLIP: ConnectingText and Images (Paper Explained)Подробнее

Video Moment Retrieval With Cross Modal Neural Architecture SearchПодробнее

Modality-Aware Representation Learning for Zero-Shot Sketch-Based Image RetrievalПодробнее

MAtch, eXpand and Improve: Unsupervised Finetuning for Zero-Shot Action Recognition with Language KПодробнее

Extending CLIP Model to Video Retrieval and Action Recognition [VLR-16824] | Final ProjectПодробнее

[CVPR 2023] Hierarchical Video-Moment Retrieval and Step-CaptioningПодробнее

Video Moment Retrieval app using Tensorflow and Django.Подробнее

Query-Dependent Video Representation for Moment Retrieval and Highlight DetectionПодробнее

【S3E8】Learning visual language models for video understandingПодробнее