Image Text To Text Models

Browse AI models for multimodal decomposition and recomposition pipelines: plug any model into your extractors.

681 models available

Run models on your own files, free Schedule Demo Read Documentation

Showing 49-72 of 681 models

Image Text To Text

nvidia/LocateAnything-3B

1.3M

2,782

transformers

View Details

Image Text To Text

RedHatAI/gemma-4-31B-it-NVFP4

1.3M

transformers

View Details

Image Text To Text

nvidia/Llama-3.1-Nemotron-Nano-VL-8B-V1

1.3M

181

transformers

View Details

Image Text To Text

microsoft/Phi-3.5-vision-instruct

1.2M

737

transformers

View Details

Image Text To Text

QuantTrio/Qwen3.6-35B-A3B-AWQ

1.2M

transformers

View Details

Image Text To Text

google/gemma-3-12b-it

1.2M

795

transformers

View Details

Image Text To Text

unsloth/Qwen3.5-4B-GGUF

1.2M

346

transformers

View Details

Image Text To Text

Qwen/Qwen3.5-122B-A10B-FP8

1.1M

111

transformers

View Details

Image Text To Text

deepseek-ai/deepseek-vl2-tiny

1.1M

249

transformers

View Details

Image Text To Text

QuantTrio/Qwen3.5-9B-AWQ

1.1M

transformers

View Details

Image Text To Text

trl-internal-testing/tiny-Qwen2_5_VLForConditionalGeneration

1.1M

transformers

View Details

Image Text To Text

RedHatAI/gemma-4-26B-A4B-it-NVFP4

1.1M

transformers

View Details

Image Text To Text

llava-hf/llava-onevision-qwen2-0.5b-ov-hf

1.0M

transformers

View Details

Image Text To Text

HuggingFaceTB/SmolVLM-256M-Instruct

1.0M

393

transformers

View Details

Image Text To Text

lmstudio-community/Qwen3.6-27B-MLX-8bit

1.0M

transformers

View Details

Image Text To Text

google/gemma-4-26B-A4B

1.0M

350

transformers

View Details

Image Text To Text

moonshotai/Kimi-K2.5

997K

2,855

transformers

View Details

Image Text To Text

lmstudio-community/gemma-4-26B-A4B-it-QAT-MLX-4bit

997K

transformers

View Details

Image Text To Text

groxaxo/Qwen3.6-27B-GPTQ-Pro-4bit

992K

transformers

View Details

Image Text To Text

unsloth/Qwen3.5-9B-GGUF

984K

792

transformers

View Details

Image Text To Text

lmstudio-community/Qwen3.6-27B-MLX-4bit

975K

transformers

View Details

Image Text To Text

Qwen/Qwen3-VL-30B-A3B-Instruct

962K

589

transformers

View Details

Image Text To Text

moonshotai/Kimi-K2.6

946K

1,573

transformers

View Details

Image Text To Text

lmstudio-community/Qwen3.6-27B-MLX-6bit

944K

transformers

View Details

...

3 / 29

Connectors

Retrievers

What's new in models

Full changelog

Jun 22, 2026200+ model pages and new retrieval deep-divesExpanded the model catalog with enriched pages (architecture, benchmarks, Mixpeek SDK examples, and pipeline pairings) across embedding, vision-language, video, audio, OCR, and reranking models: plus new vendor-neutral guides on Matryoshka embeddings, reasoning rerankers, and retrieval feedback loops.