Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

1,365

Full-text search

Active filters: speech

openbmb/VoxCPM1.5

Text-to-Speech • Updated about 23 hours ago • 1.54k • 147

pyannote/speaker-diarization-3.1

Automatic Speech Recognition • Updated May 10, 2024 • 15.8M • 1.36k

ResembleAI/chatterbox

Text-to-Speech • Updated Sep 23 • 652k • • 1.32k

nvidia/parakeet-tdt-0.6b-v3

Automatic Speech Recognition • Updated 16 days ago • 74.5k • 446

nvidia/canary-qwen-2.5b

Automatic Speech Recognition • 3B • Updated 10 days ago • 11.1k • 320

nvidia/multitalker-parakeet-streaming-0.6b-v1

Audio Classification • Updated 4 days ago • 193 • 36

nvidia/canary-1b-v2

Automatic Speech Recognition • Updated 10 days ago • 105k • 319

pyannote/segmentation-3.0

Voice Activity Detection • Updated May 10, 2024 • 17.5M • 691

nvidia/parakeet-tdt-0.6b-v2

Automatic Speech Recognition • Updated 16 days ago • 459k • 1.38k

pyannote/speaker-diarization-community-1

Automatic Speech Recognition • Updated Sep 29 • 496k • 115

openbmb/VoxCPM-0.5B

Text-to-Speech • Updated Sep 19 • 2.37k • 776

neuphonic/neutts-air

Text-to-Speech • 0.7B • Updated Oct 10 • 24.1k • 800

mlx-community/VoxCPM1.5

Text-to-Speech • 0.9B • Updated 4 days ago • 57 • 4

TEN-framework/ten-vad

Updated Jul 9 • 66 • 122

nvidia/diar_streaming_sortformer_4spk-v2.1

Audio Classification • Updated 8 days ago • 390 • 18

IbrahimSalah/Arabic-TTS-Spark

Text-to-Speech • Updated 16 days ago • 2.9k • 10

facebook/wav2vec2-xls-r-300m

Updated Aug 10, 2022 • 228k • 111

microsoft/wavlm-large

Feature Extraction • Updated Feb 2, 2022 • 338k • 92

pyannote/speaker-diarization

Automatic Speech Recognition • Updated May 10, 2024 • 888k • 1.21k

nvidia/canary-1b

Automatic Speech Recognition • Updated 10 days ago • 3.09k • 452

fierce-cats/beatrice-trainer

Audio-to-Audio • Updated Aug 30 • 37

galsenai/xTTS-v2-wolof

Updated 14 days ago • 29

nvidia/canary-1b-flash

Automatic Speech Recognition • 0.8B • Updated 10 days ago • 288k • 259

nvidia/diar_streaming_sortformer_4spk-v2

Audio Classification • Updated 10 days ago • 12k • 79

FluidInference/speaker-diarization-coreml

Voice Activity Detection • Updated Oct 20 • 1.88k • 17

FluidInference/silero-vad-coreml

Voice Activity Detection • Updated Sep 17 • 5.61k • 10

shunyalabs/pingala-v1-universal

Automatic Speech Recognition • 0.8B • Updated Aug 28 • 99 • 28

mlx-community/parakeet-tdt-0.6b-v3

Automatic Speech Recognition • Updated Aug 16 • 73.9k • 21

onnx-community/chatterbox-multilingual-ONNX

Text-to-Speech • Updated Oct 28 • 308 • 22

NandemoGHS/Anime-XCodec2-44.1kHz-v2

Audio-to-Audio • Updated Oct 28 • 951 • 9