Audio Classification Models

Browse AI models for multimodal decomposition and recomposition pipelines: plug any model into your extractors.

599 models available

Run models on your own files, free Schedule Demo Read Documentation

Showing 1-24 of 599 models

Audio Classification

laion/clap-htsat-fused

8.5M

119

transformers

View Details

Audio Classification

alefiury/wav2vec2-large-xlsr-53-gender-recognition-librispeech

916K

transformers

View Details

Audio Classification

audeering/wav2vec2-large-robust-12-ft-emotion-msp-dim

596K

173

transformers

View Details

Audio Classification

MIT/ast-finetuned-audioset-10-10-0.4593

571K

362

transformers

View Details

Audio Classification

m-a-p/MERT-v1-330M

491K

transformers

View Details

Audio Classification

OpenMuQ/MuQ-large-msd-iter

309K

View Details

Audio Classification

facebook/audiobox-aesthetics

300K

View Details

Audio Classification

onecxi/open-vakgyata

273K

transformers

View Details

Audio Classification

audeering/wav2vec2-large-robust-24-ft-age-gender

268K

transformers

View Details

Audio Classification

xbgoose/hubert-large-speech-emotion-recognition-russian-dusha-finetuned

267K

transformers

View Details

Audio Classification

facebook/mms-lid-256

259K

transformers

View Details

Audio Classification

facebook/mms-lid-126

219K

transformers

View Details

Audio Classification

prithivMLmods/Common-Voice-Gender-Detection

173K

transformers

View Details

Audio Classification

speechbrain/lang-id-voxlingua107-ecapa

111K

154

speechbrain

View Details

Audio Classification

facebook/mms-lid-1024

97K

transformers

View Details

Audio Classification

JaesungHuh/voice-gender-classifier

87K

transformers

View Details

Audio Classification

m-a-p/MERT-v1-95M

82K

transformers

View Details

Audio Classification

aufklarer/WeSpeaker-ResNet34-LM-MLX

81K

mlx

View Details

Audio Classification

superb/wav2vec2-base-superb-er

64K

transformers

View Details

Audio Classification

speechbrain/emotion-recognition-wav2vec2-IEMOCAP

61K

188

speechbrain

View Details

Audio Classification

OpenMuQ/MuQ-MuLan-large

47K

View Details

Audio Classification

awsaf49/sonics-spectttra-gamma-5s

41K

View Details

Audio Classification

facebook/mms-lid-4017

40K

transformers

View Details

Audio Classification

aufklarer/Qwen3-ForcedAligner-0.6B-4bit

37K

mlx

View Details

...

1 / 25

Connectors

Retrievers

What's new in models

Full changelog

Jun 22, 2026200+ model pages and new retrieval deep-divesExpanded the model catalog with enriched pages (architecture, benchmarks, Mixpeek SDK examples, and pipeline pairings) across embedding, vision-language, video, audio, OCR, and reranking models: plus new vendor-neutral guides on Matryoshka embeddings, reasoning rerankers, and retrieval feedback loops.