Automatic Speech Recognition Models

Browse AI models for multimodal decomposition and recomposition pipelines: plug any model into your extractors.

461 models available

Run models on your own files, free Schedule Demo Read Documentation

Showing 1-24 of 461 models

Automatic Speech Recognition

pyannote/speaker-diarization-3.1

8.7M

2,852

pyannote-audio

View Details

Automatic Speech Recognition

openai/whisper-large-v3-turbo

8.4M

3,189

transformers

View Details

Automatic Speech Recognition

argmaxinc/whisperkit-coreml

7.8M

199

whisperkit

View Details

Automatic Speech Recognition

openai/whisper-base

6.5M

279

transformers

View Details

Automatic Speech Recognition

openai/whisper-large-v3

6.0M

5,987

transformers

View Details

Automatic Speech Recognition

pyannote/speaker-diarization-community-1

5.2M

860

pyannote-audio

View Details

Automatic Speech Recognition

jonatasgrosman/wav2vec2-large-xlsr-53-portuguese

3.6M

transformers

View Details

Automatic Speech Recognition

jonatasgrosman/wav2vec2-large-xlsr-53-russian

3.4M

transformers

View Details

Automatic Speech Recognition

pyannote/voice-activity-detection

3.4M

239

pyannote-audio

View Details

Automatic Speech Recognition

jonatasgrosman/wav2vec2-large-xlsr-53-polish

2.6M

transformers

View Details

Automatic Speech Recognition

openai/whisper-small

2.5M

575

transformers

View Details

Automatic Speech Recognition

MahmoudAshraf/mms-300m-1130-forced-aligner

2.5M

transformers

View Details

Automatic Speech Recognition

Systran/faster-whisper-small

2.0M

ctranslate2

View Details

Automatic Speech Recognition

mistralai/Voxtral-Mini-4B-Realtime-2602

2.0M

929

vllm

View Details

Automatic Speech Recognition

openai/whisper-tiny

1.8M

436

transformers

View Details

Automatic Speech Recognition

Qwen/Qwen3-ASR-1.7B

1.8M

948

View Details

Automatic Speech Recognition

mlx-community/parakeet-tdt-0.6b-v2

1.8M

mlx

View Details

Automatic Speech Recognition

jonatasgrosman/wav2vec2-large-xlsr-53-dutch

1.7M

transformers

View Details

Automatic Speech Recognition

handy-computer/nemotron-3.5-asr-streaming-0.6b-gguf

1.7M

transcribe.cpp

View Details

Automatic Speech Recognition

distil-whisper/distil-large-v3

1.7M

376

transformers

View Details

Automatic Speech Recognition

handy-computer/parakeet-unified-en-0.6b-gguf

1.5M

transcribe.cpp

View Details

Automatic Speech Recognition

facebook/wav2vec2-base-960h

1.5M

400

transformers

View Details

Automatic Speech Recognition

jonatasgrosman/wav2vec2-large-xlsr-53-japanese

1.5M

transformers

View Details

Automatic Speech Recognition

Qwen/Qwen3-ASR-0.6B

1.5M

322

View Details

...

1 / 20

Connectors

Retrievers

What's new in models

Full changelog

Jun 22, 2026200+ model pages and new retrieval deep-divesExpanded the model catalog with enriched pages (architecture, benchmarks, Mixpeek SDK examples, and pipeline pairings) across embedding, vision-language, video, audio, OCR, and reranking models: plus new vendor-neutral guides on Matryoshka embeddings, reasoning rerankers, and retrieval feedback loops.