Image To Text Models

Browse AI models for multimodal decomposition and recomposition pipelines — plug any model into your extractors.

478 models available

Run models on your own files, free Schedule Demo Read Documentation

Showing 1–24 of 478 models

Image To Text

Salesforce/blip-image-captioning-base

1.6M

867

transformers

View Details

Image To Text

numind/NuExtract3

1.2M

294

transformers

View Details

Image To Text

Salesforce/blip-image-captioning-large

765K

1,477

transformers

View Details

Image To Text

PaddlePaddle/PP-OCRv5_server_det

640K

PaddleOCR

View Details

Image To Text

ibm-granite/granite-vision-3.3-2b

458K

View Details

Image To Text

PaddlePaddle/UVDoc

450K

PaddleOCR

View Details

Image To Text

kha-white/manga-ocr-base

434K

176

transformers

View Details

Image To Text

microsoft/trocr-small-handwritten

426K

transformers

View Details

Image To Text

PaddlePaddle/PP-LCNet_x1_0_doc_ori

385K

PaddleOCR

View Details

Image To Text

PaddlePaddle/en_PP-OCRv5_mobile_rec

374K

PaddleOCR

View Details

Image To Text

microsoft/trocr-base-printed

331K

215

transformers

View Details

Image To Text

microsoft/trocr-large-handwritten

204K

162

transformers

View Details

Image To Text

PaddlePaddle/PP-LCNet_x1_0_textline_ori

197K

PaddleOCR

View Details

Image To Text

microsoft/kosmos-2-patch14-224

172K

184

transformers

View Details

Image To Text

microsoft/trocr-base-handwritten

164K

502

transformers

View Details

Image To Text

PaddlePaddle/PP-OCRv5_server_rec

153K

PaddleOCR

View Details

Image To Text

lightonai/LightOnOCR-1B-1025

142K

254

transformers

View Details

Image To Text

microsoft/trocr-large-printed

117K

180

transformers

View Details

Image To Text

optimum-intel-internal-testing/pix2struct-tiny-random

109K

View Details

Image To Text

PaddlePaddle/PP-OCRv6_medium_det

105K

PaddleOCR

View Details

Image To Text

PaddlePaddle/PP-OCRv5_mobile_det

97K

PaddleOCR

View Details

Image To Text

facebook/nougat-base

96K

188

transformers

View Details

Image To Text

PaddlePaddle/PP-OCRv6_medium_rec

92K

PaddleOCR

View Details

Image To Text

alibaba-damo/mgp-str-base

85K

transformers

View Details

...

1 / 20

Connectors

Retrievers

What's new in models

Full changelog

Jun 22, 2026200+ model pages and new retrieval deep-divesExpanded the model catalog with enriched pages (architecture, benchmarks, Mixpeek SDK examples, and pipeline pairings) across embedding, vision-language, video, audio, OCR, and reranking models — plus new vendor-neutral guides on Matryoshka embeddings, reasoning rerankers, and retrieval feedback loops.