ElevenLabs 级别的 30 亿参数开源 TTS 模型

1作者: freakynit7 个月前
1. 自然语言语音控制 2. 15+ 种内嵌情感标签,用于表达性语音 3. 流式音频生成 4. vLLM 集成 5. 可在单块 GPU 上运行 https://huggingface.co/maya-research/maya1
查看原文
1. Natural Language Voice Control<p>2. 15+ Inline Emotion Tags for Expressive Speech<p>3. Streaming Audio Generation<p>4. vLLM integration<p>5. Runs on single GPU<p>https:&#x2F;&#x2F;huggingface.co&#x2F;maya-research&#x2F;maya1