1作者: jag7295 个月前
大家好,HN!Voicelab 是一个 API,用于优化顶级开源 TTS 模型的推理。目前支持 CSM-1B 和 Orpheus 模型,但我们将在未来几周内添加 Dia、Chatterbox、Kokoro 等更多模型。 虽然每个月都会有新的超逼真开源语音模型发布,但大多数人仍然使用少数几个闭源提供商。原因是这些研究预览可能缺乏生产就绪性;它们的推理堆栈通常不适合大规模运行(例如,每个 GPU 只有一个并发流),并且公开权重可能会生成质量不一致的语音。 我们通过构建针对音频转换器优化的服务基础设施(以使可扩展推理更快、更具成本效益)以及使用配音演员、电话呼叫和其他私下收集的音频数据对公开权重进行后训练(以使生成质量更一致)来解决这个问题。 开源语音变得越来越令人兴奋,我们希望能够提供一个高质量、可扩展的推理层,以利用这些团队发布的所有丰富研究成果。非常感谢您的反馈 :) 文档:docs.vogent.ai 游乐场:app.vogent.ai
2作者: namulongboi5 个月前
我很好奇。很多创始人会在拿到 Series XYZ 轮融资之前,都采取“股权换现金”的模式吗?还是说,他们通常能赚最多,因为他们是公司的所有者? 我们假设在旧金山/纽约,并且获得了顶级风投的充足资金。
3作者: jakejohnson5 个月前
嗨 HN,我在帮助客户预测 AI 智能体的费用时,反复遇到同样的问题。定价可能很复杂,需要认真的电子表格计算。你需要考虑不同的模型层级、token 预估、提示缓存,以及特定工作流程中各种各样的服务。<p>在为每个客户手动构建电子表格后,我决定构建 BotBudget - 一个免费的计算器,用于模拟数百个 LLM 模型和 AI 服务的成本。<p>主要功能:<p><pre><code> - 多服务工作流程(LLM + STT/TTS + RAG + 安全防护) - 主要供应商的最新定价数据 - 内置分词器,用于提示预估 - 带有增长情景的成本预测 - 可共享的团队链接 </code></pre> 它对我的咨询工作很有帮助,我希望其他构建 AI 产品的人也能觉得它有用。<p>在 botbudget.com 试用 - 欢迎反馈缺少什么或可以改进的地方。<p>顺便说一下,简单的技术栈:它使用 Next.js 构建,托管在 Cloudflare Workers 上,使用 @opennextjs/cloudflare,并且使用来自自我和社区维护的来源的 GitHub Workflows 每天更新的扁平 JSON 定价数据。
1作者: pinter695 个月前
我打算重启我以前的邮件通讯,同时建立一个新的网站。 网站上的每个页面也将作为一封邮件发送。我希望找到一个易于使用的设置,这样我就能拥有数据和读者,并且不必依赖某个平台,确保它在未来几年内依然存在,并能以合理的价格持续为我服务。