Audio Tasks - a alecccdd Collection

alecccdd 's Collections

Fun

Impressive Large Models

Vision Tasks (Watermark)

Vision Tasks (Humans)

Vision Datasets

Vision Datasets (Human)

Diffusion Tasks

Text Generation

Text Datasets (Reasoning)

Text Datasets (Grammar)

ReID

small & highly efficient

Audio Tasks

updated 14 days ago

Soul-AILab/SoulX-Podcast-1.7B

Text-to-Speech • Updated Dec 18, 2025 • 391 • 231
bosonai/higgs-audio-v2-generation-3B-base

Text-to-Speech • 6B • Updated Jul 28, 2025 • 155k • 657
Running

32

Vocal Isolator

🗣

32

Isolate vocals from audio files
nvidia/personaplex-7b-v1

Audio-to-Audio • Updated 8 days ago • 162k • 1.67k
FlashLabs/Chroma-4B

Any-to-Any • 6B • Updated 9 days ago • 9k • 324
Running on Zero

Featured

1.25k

Qwen3-TTS Demo

🎙

1.25k

Transform text into natural-sounding speech with custom voices
Qwen/Qwen3-TTS-12Hz-1.7B-CustomVoice

Text-to-Speech • 2B • Updated 8 days ago • 332k • 882