1 分•作者: nutanc•23 天前
返回首页
最新
1 分•作者: duck•23 天前
1 分•作者: pillars•23 天前
16 分•作者: sadeshmukh•23 天前
16 分•作者: insistey•23 天前
1 分•作者: puppion•23 天前
1 分•作者: digi_wares•23 天前
嗨,HN,
我开发了一个完全在浏览器中运行的语音转文本工具。免费版无需注册,也不会将数据发送到我的服务器。
试用:[https://voicetotextonline.com](https://voicetotextonline.com)
我为什么开发这个工具:
* 现有的工具需要注册、有时间限制或收费
* Google Docs 的语音输入需要 Google 账号
* Dragon 售价 150-500 美元
* Otter.ai 的免费版有使用限制
(A) 免费功能(无需注册):
1/ 核心转录:
* 使用 Web Speech API 进行实时语音转文本
* 支持 55+ 种语言
* 自动标点符号和句子大小写选项
* 首次加载后可离线使用(PWA)
2/ AI 增强(根据用户调查添加 – 80% 投了赞成票):
* 自动修复语法、标点符号和格式
* 一键清理转录文本
3/ 我的项目(本地存储):
* 将转录文本保存到浏览器 localStorage
* 使用文件夹进行组织(笔记、工作、个人等)
* 自定义文件夹和标签
* 搜索所有转录文本
* 编辑、复制、下载为 TXT 格式
* 100% 私密 – 永不离开您的设备
* 导出:
* 复制到剪贴板
* 下载为 TXT 或 DOCX 格式
(B) 专业版功能(每月 10 美元或按使用量付费,每小时 1 美元):
1/ 文件上传和转录:
* 上传音频/视频文件(MP3、WAV、M4A、MP4、MOV、AVI、MKV)
* 每个文件最大 500MB
* 批量上传(一次 10 个文件)
* 由 AssemblyAI 提供支持(准确率 95% 以上)
* 每月 150 小时转录时间
2/ 高级功能:
* 实时进度和预计完成时间
* 说话人标签
* 浏览器内录音(5 分钟,可暂停/恢复)
* 翻译成 25+ 种语言(GPT-4o)
3/ 导出格式:
* TXT、SRT、VTT、JSON(带时间戳)
* 段落级别的时间戳精度
4/ 云存储:
* 云端转录历史记录
* 10 GB 存储空间,每月 1,000 个文件
(C) 数据和隐私:
免费版:
* 所有转录文本仅存储在浏览器 localStorage 中
* 从不接触我们的服务器
* 100% 私密
专业版:
* 音频文件存储在 Supabase 中(加密)
* 文件保留 30 天,以便重新下载,然后自动删除
* 转录文本永久存储在您的帐户中
* 您可以随时删除任何转录文本或您的整个帐户
* 我们不会使用您的数据进行训练
技术栈:
* Next.js 14 (App Router)
* Web Speech API(免费实时转录)
* AssemblyAI(专业版文件转录,准确率 95% 以上)
* OpenAI GPT-4o(AI 增强和翻译)
* Supabase(身份验证和存储)
* Stripe(支付)
* Tailwind CSS
* 托管在 Vercel 上
限制:
* 实时转录在 Firefox 中不起作用(不支持 Web Speech API)
* 免费版的准确性取决于 Chrome 的语音引擎
欢迎提供关于用户体验、定价或功能想法的反馈。正在考虑开源核心转录组件。
9 分•作者: chuckepstein•23 天前
1 分•作者: nxank4•23 天前
Hi HN,
我构建了这个库,因为我希望有一种方法可以清理混乱的文本数据并提取 PII(个人身份信息),而无需将敏感信息发送到云 API 或处理脆弱的正则表达式模式。
该工具通过 llama.cpp 在本地运行量化模型,并使用从 Pydantic 模型生成的 GBNF 语法。这强制 LLM 输出严格遵守模式的有效 JSON,从而解决了小型模型常见的可靠性问题。它目前支持 Pandas 和 Polars 数据框,并可与任何 GGUF 模型配合使用。
这仍处于早期 alpha 阶段,因此在旧 CPU 上的性能可能成为瓶颈,与标准字符串操作相比有所不如,但我发现它对正则表达式失败的语义提取任务很有用。我非常感谢您对实施方案的任何反馈或优化建议。
1 分•作者: exvi•23 天前
2 分•作者: Geo_ge•23 天前
2 分•作者: g-b-r•23 天前
1 分•作者: blondie9x•23 天前
2 分•作者: exvi•23 天前
1 分•作者: exvi•23 天前
10 分•作者: jafioti•23 天前
1 分•作者: azhenley•23 天前
5 分•作者: jethronethro•23 天前
1 分•作者: jimiwen•23 天前
1 分•作者: felineflock•23 天前