Audio To Audio Models

Browse AI models for multimodal decomposition and recomposition pipelines: plug any model into your extractors.

150 models available

Run models on your own files, free Schedule Demo Read Documentation

Showing 73-96 of 150 models

Audio To Audio

speechbrain/sepformer-libri2mix

437

speechbrain

View Details

Audio To Audio

JorisCos/ConvTasNet_Libri2Mix_sepclean_8k

433

asteroid

View Details

Audio To Audio

nvidia/bigvgan_base_22khz_80band

429

PyTorch

View Details

Audio To Audio

cadenzachallenge/ConvTasNet_Lyrics_Causal

416

transformers

View Details

Audio To Audio

patriotyk/vocos-mel-hifigan-compat-44100khz

412

View Details

Audio To Audio

aufklarer/PersonaPlex-7B-MLX-8bit

405

mlx

View Details

Audio To Audio

Malfaro43/Realtime-REUSE-whisper-finetune

396

mamba-ssm

View Details

Audio To Audio

MansfieldPlumbing/Demucs_v4_TRT

376

tensorrt

View Details

Audio To Audio

CofeAI/FLM-Audio

369

View Details

Audio To Audio

NextFire/tsurumeso-vocal-remover

369

transformers

View Details

Audio To Audio

Ceva-IP/DPDFNet

355

View Details

Audio To Audio

JorisCos/ConvTasNet_Libri3Mix_sepnoisy_16k

345

asteroid

View Details

Audio To Audio

cstr/Sidon-GGUF

323

View Details

Audio To Audio

cstr/htdemucs-GGUF

313

View Details

Audio To Audio

maitrix-org/Voila-Tokenizer

309

transformers

View Details

Audio To Audio

slprl/SIMS-Llama3.2-3B

301

transformers

View Details

Audio To Audio

speechbrain/sepformer-dns4-16k-enhancement

300

speechbrain

View Details

Audio To Audio

Xiaobin-Rong/unipase

300

View Details

Audio To Audio

speechbrain/sepformer-wsj03mix

293

speechbrain

View Details

Audio To Audio

cstr/miocodec-v2-44k-GGUF

281

View Details

Audio To Audio

kyutai/moshika-rag-candle-bf16

272

moshi

View Details

Audio To Audio

speechbrain/sepformer-libri3mix

264

speechbrain

View Details

Audio To Audio

lucadellalib/focalcodec_50hz_4k_causal

263

torch

View Details

Audio To Audio

aufklarer/LocalVQE-v1.4-AEC-200K-CoreML

262

coreml

View Details

4 / 7

Connectors

Retrievers

What's new in models

Full changelog

Jun 22, 2026200+ model pages and new retrieval deep-divesExpanded the model catalog with enriched pages (architecture, benchmarks, Mixpeek SDK examples, and pipeline pairings) across embedding, vision-language, video, audio, OCR, and reranking models: plus new vendor-neutral guides on Matryoshka embeddings, reasoning rerankers, and retrieval feedback loops.