Image Text To Text Models

Browse AI models for multimodal decomposition and recomposition pipelines: plug any model into your extractors.

681 models available

Run models on your own files, free Schedule Demo Read Documentation

Showing 121-144 of 681 models

Image Text To Text

Salesforce/blip2-opt-2.7b

518K

446

transformers

View Details

Image Text To Text

QuantTrio/Qwen3-VL-32B-Instruct-AWQ

514K

transformers

View Details

Image Text To Text

unsloth/gemma-4-E4B-it-GGUF

511K

567

View Details

Image Text To Text

Jackrong/Qwopus3.6-27B-Coder-Compat-MTP-GGUF

507K

130

transformers

View Details

Image Text To Text

unsloth/gemma-4-26B-A4B-it-qat-GGUF

496K

341

transformers

View Details

Image Text To Text

OpenGVLab/InternVL3-1B

489K

transformers

View Details

Image Text To Text

google/medgemma-1.5-4b-it

471K

744

transformers

View Details

Image Text To Text

google/gemma-3n-E2B-it

464K

315

transformers

View Details

Image Text To Text

sakamakismile/Ornith-1.0-35B-NVFP4

462K

transformers

View Details

Image Text To Text

unsloth/gemma-4-E4B-it-unsloth-bnb-4bit

456K

View Details

Image Text To Text

unsloth/gemma-4-E2B-it-GGUF

450K

268

View Details

Image Text To Text

meta-llama/Llama-4-Scout-17B-16E-Instruct

449K

1,330

transformers

View Details

Image Text To Text

openbmb/MiniCPM-V-4_5

447K

1,096

transformers

View Details

Image Text To Text

nvidia/Cosmos-Reason2-2B

446K

131

cosmos

View Details

Image Text To Text

dots-studio/dots.ocr

445K

1,318

dots_ocr

View Details

Image Text To Text

rednote-hilab/dots.ocr

424K

1,316

dots_ocr

View Details

Image Text To Text

trl-internal-testing/tiny-Qwen3_5ForConditionalGeneration-NoThink

421K

transformers

View Details

Image Text To Text

zai-org/GLM-4.1V-9B-Thinking

421K

781

transformers

View Details

Image Text To Text

maci0/Qwopus3.6-27B-Coder-NVFP4

416K

transformers

View Details

Image Text To Text

cyankiwi/Qwen3.5-9B-AWQ-4bit

415K

transformers

View Details

Image Text To Text

trl-internal-testing/tiny-Qwen3_5MoeForConditionalGeneration-3.6

411K

transformers

View Details

Image Text To Text

Qwen/Qwen3.5-397B-A17B

410K

1,539

transformers

View Details

Image Text To Text

Qwen/Qwen3.5-9B-Base

405K

transformers

View Details

Image Text To Text

stepfun-ai/GOT-OCR2_0

401K

1,548

View Details

......

6 / 29

Connectors

Retrievers

What's new in models

Full changelog

Jun 22, 2026200+ model pages and new retrieval deep-divesExpanded the model catalog with enriched pages (architecture, benchmarks, Mixpeek SDK examples, and pipeline pairings) across embedding, vision-language, video, audio, OCR, and reranking models: plus new vendor-neutral guides on Matryoshka embeddings, reasoning rerankers, and retrieval feedback loops.