Automatic Speech Recognition Models

Browse AI models for multimodal decomposition and recomposition pipelines: plug any model into your extractors.

450 models available

Run models on your own files, free Schedule Demo Read Documentation

Showing 1-24 of 450 models

Automatic Speech Recognition

pyannote/speaker-diarization-3.1

8.3M

2,770

pyannote-audio

View Details

Automatic Speech Recognition

argmaxinc/whisperkit-coreml

8.2M

198

whisperkit

View Details

Automatic Speech Recognition

openai/whisper-large-v3-turbo

8.1M

3,174

transformers

View Details

Automatic Speech Recognition

openai/whisper-base

6.3M

278

transformers

View Details

Automatic Speech Recognition

openai/whisper-large-v3

5.8M

5,960

transformers

View Details

Automatic Speech Recognition

pyannote/speaker-diarization-community-1

4.5M

794

pyannote-audio

View Details

Automatic Speech Recognition

openai/whisper-small

3.2M

575

transformers

View Details

Automatic Speech Recognition

jonatasgrosman/wav2vec2-large-xlsr-53-portuguese

3.2M

transformers

View Details

Automatic Speech Recognition

pyannote/voice-activity-detection

3.0M

239

pyannote-audio

View Details

Automatic Speech Recognition

jonatasgrosman/wav2vec2-large-xlsr-53-russian

3.0M

transformers

View Details

Automatic Speech Recognition

jonatasgrosman/wav2vec2-large-xlsr-53-polish

2.9M

transformers

View Details

Automatic Speech Recognition

MahmoudAshraf/mms-300m-1130-forced-aligner

2.6M

transformers

View Details

Automatic Speech Recognition

mistralai/Voxtral-Mini-4B-Realtime-2602

2.0M

918

vllm

View Details

Automatic Speech Recognition

jonatasgrosman/wav2vec2-large-xlsr-53-dutch

1.9M

transformers

View Details

Automatic Speech Recognition

openai/whisper-tiny

1.9M

436

transformers

View Details

Automatic Speech Recognition

jonatasgrosman/wav2vec2-large-xlsr-53-greek

1.9M

transformers

View Details

Automatic Speech Recognition

indonesian-nlp/wav2vec2-indonesian-javanese-sundanese

1.8M

transformers

View Details

Automatic Speech Recognition

jonatasgrosman/wav2vec2-large-xlsr-53-arabic

1.8M

transformers

View Details

Automatic Speech Recognition

mlx-community/parakeet-tdt-0.6b-v2

1.8M

mlx

View Details

Automatic Speech Recognition

Systran/faster-whisper-small

1.7M

ctranslate2

View Details

Automatic Speech Recognition

jonatasgrosman/wav2vec2-large-xlsr-53-japanese

1.6M

transformers

View Details

Automatic Speech Recognition

jonatasgrosman/wav2vec2-large-xlsr-53-hungarian

1.5M

transformers

View Details

Automatic Speech Recognition

Qwen/Qwen3-ASR-1.7B

1.5M

934

View Details

Automatic Speech Recognition

facebook/wav2vec2-base-960h

1.5M

399

transformers

View Details

...

1 / 19

Connectors

Retrievers

What's new in models

Full changelog

Jun 22, 2026200+ model pages and new retrieval deep-divesExpanded the model catalog with enriched pages (architecture, benchmarks, Mixpeek SDK examples, and pipeline pairings) across embedding, vision-language, video, audio, OCR, and reranking models: plus new vendor-neutral guides on Matryoshka embeddings, reasoning rerankers, and retrieval feedback loops.