Visual Question Answering Models

Browse AI models for multimodal decomposition and recomposition pipelines: plug any model into your extractors.

365 models available

Run models on your own files, free Schedule Demo Read Documentation

Showing 49-72 of 365 models

Visual Question Answering

saillab/FlipLens

199

transformers

View Details

Visual Question Answering

gaianet/MiniCPM-Llama3-V-2_5-GGUF

189

View Details

Visual Question Answering

openbmb/MiniCPM-Llama3-V-2_5-int4

184

transformers

View Details

Visual Question Answering

OpenGVLab/InternVL-Chat-ViT-6B-Vicuna-7B

176

transformers

View Details

Visual Question Answering

erax-ai/EraX-VL-7B-V2.0-Preview

174

transformers

View Details

Visual Question Answering

internlm/internlm-xcomposer2d5-7b-4bit

173

transformers

View Details

Visual Question Answering

qihoo360/360VL-8B

164

transformers

View Details

Visual Question Answering

mradermacher/CoE-Wiki-CoE-8B-i1-GGUF

161

transformers

View Details

Visual Question Answering

mradermacher/CoE-Wiki-CoE-8B-GGUF

150

transformers

View Details

Visual Question Answering

mradermacher/ViGOS-3B-GGUF

150

transformers

View Details

Visual Question Answering

google/pix2struct-docvqa-large

149

transformers

View Details

Visual Question Answering

gaianet/MiniCPM-V-4-GGUF

147

View Details

Visual Question Answering

second-state/MiniCPM-V-4-GGUF

144

View Details

Visual Question Answering

RogerFerrod/GroundSet-LLaVA-1.6-7B

144

View Details

Visual Question Answering

gaianet/MiniCPM-V-4_5-GGUF

143

View Details

Visual Question Answering

google/pix2struct-screen2words-base

139

transformers

View Details

Visual Question Answering

atky/Qwen-3-VL-Ricoh-8B-20260227-Q5_K_M-GGUF

138

View Details

Visual Question Answering

XiaofengAlg/MechVL-4B-SFT

128

transformers

View Details

Visual Question Answering

mPLUG/mPLUG-Owl3-7B-241101

127

View Details

Visual Question Answering

wumengyangok/LLaVA-SpaceSGG

125

View Details

Visual Question Answering

yanka9/vilt_finetuned_deepfashionVQA_v2

118

transformers

View Details

Visual Question Answering

BAAI/Aquila-VL-2B-llava-qwen

110

transformers

View Details

Visual Question Answering

VLM-Reasoner/LMM-R1-MGT-PerceReason

110

View Details

Visual Question Answering

OpenGVLab/InternVL-Chat-ViT-6B-Vicuna-13B

106

transformers

View Details

...

3 / 16

Connectors

Retrievers

What's new in models

Full changelog

Jun 22, 2026200+ model pages and new retrieval deep-divesExpanded the model catalog with enriched pages (architecture, benchmarks, Mixpeek SDK examples, and pipeline pairings) across embedding, vision-language, video, audio, OCR, and reranking models: plus new vendor-neutral guides on Matryoshka embeddings, reasoning rerankers, and retrieval feedback loops.