Text To Audio Models

Browse AI models for multimodal decomposition and recomposition pipelines: plug any model into your extractors.

470 models available

Run models on your own files, free Schedule Demo Read Documentation

Showing 49-72 of 470 models

Text To Audio

marcorez8/acestep-v15-xl-turbo-bf16

transformers

View Details

Text To Audio

AEmotionStudio/stable-audio-open-models

diffusers

View Details

Text To Audio

OpenMOSS-Team/MOSS-SoundEffect

View Details

Text To Audio

forkjoin-ai/qwen2-audio-7b-instruct-gguf

llama-cpp

View Details

Text To Audio

riffusion/riffusion-model-v1

650

diffusers

View Details

Text To Audio

khmerttsopensource/khmer-tts

976

transformers

View Details

Text To Audio

ahmedjaved812/urdu-tts-phonemes-finetuned-extended

874

transformers

View Details

Text To Audio

HeartMuLa/HeartMuLa-oss-3B

762

256

View Details

Text To Audio

cocktailpeanut/stable-audio-3-small-sfx

670

stable-audio-3

View Details

Text To Audio

OzzyGT/LTX-2.3-Distilled-1.1-sdnq-dynamic-int8

666

diffusers

View Details

Text To Audio

thepatch/stable-audio-3-medium-GGUF

658

View Details

Text To Audio

ahmedjaved812/urdu-tts-phonemes-finetuned

633

transformers

View Details

Text To Audio

razhan/mms-tts-ckb

620

transformers

View Details

Text To Audio

audiohacking/dasheng-audiogen-gguf

569

View Details

Text To Audio

tencent/SongGeneration

568

348

tencent-song-generation

View Details

Text To Audio

yuhuacheng/clap-musicgen

564

View Details

Text To Audio

ylacombe/musicgen-stereo-melody

528

transformers

View Details

Text To Audio

FabioSarracino/VibeVoice-Large-Q8

512

transformers

View Details

Text To Audio

Marvis-AI/marvis-tts-250m-v0.1-MLX-8bit

504

transformers

View Details

Text To Audio

thepatch/stable-audio-3-small-music-GGUF

493

View Details

Text To Audio

HKUSTAudio/AudioX-MAF

475

View Details

Text To Audio

thepatch/t5gemma-b-b-ul2-GGUF

474

View Details

Text To Audio

truongchinh5712/chinh_speecht5_finetuned_fipilot

466

transformers

View Details

Text To Audio

mradermacher/zen-musician-i1-GGUF

463

transformers

View Details

...

3 / 20

Connectors

Retrievers

What's new in models

Full changelog

Jun 22, 2026200+ model pages and new retrieval deep-divesExpanded the model catalog with enriched pages (architecture, benchmarks, Mixpeek SDK examples, and pipeline pairings) across embedding, vision-language, video, audio, OCR, and reranking models: plus new vendor-neutral guides on Matryoshka embeddings, reasoning rerankers, and retrieval feedback loops.