ElevenLabs 级别的 30 亿参数开源 TTS 模型
1 分•作者: freakynit•7 个月前
1. 自然语言语音控制
2. 15+ 种内嵌情感标签,用于表达性语音
3. 流式音频生成
4. vLLM 集成
5. 可在单块 GPU 上运行
https://huggingface.co/maya-research/maya1
查看原文
1. Natural Language Voice Control<p>2. 15+ Inline Emotion Tags for Expressive Speech<p>3. Streaming Audio Generation<p>4. vLLM integration<p>5. Runs on single GPU<p>https://huggingface.co/maya-research/maya1