1 分•作者: pabs3•6 个月前
返回首页
最新
1 分•作者: ksec•6 个月前
1 分•作者: WaitWaitWha•6 个月前
1 分•作者: qinggeng•6 个月前
作为一个长期沉浸于世界构建和TRPG(桌面角色扮演游戏)的人,我一直觉得现有工具存在一些不足。现有的名字生成器擅长根据规则组合音节,但它们无法捕捉某种感觉或氛围。你无法要求它们生成听起来像“一个古老、沉没的王国”的名字。
Nomenus 是我尝试解决这个问题的方法。它是一个由 AI 驱动的工具,围绕一个简单的提示展开,允许你用简单、自然的语言描述你想要的名字。
例如,你可以要求它生成“一个脾气暴躁但忠诚的矮人铁匠,内心深爱诗歌”的名字,它会根据这个特定语境生成结果,通常还会附带一些背景故事。
你现在看到的网站是第一个 MVP(最小可行产品)。它使用 Next.js (App Router)、Supabase 构建,并在 Cloudflare Workers 上运行。
我在这里在 HN(Hacker News)上发布它,是为了从一个欣赏产品构建过程的社区中获得诚实的反馈。我特别感兴趣的是:
* 这个核心概念是否真的比传统的生成器更有用?
* 对 UI/UX 有什么看法?
* 我应该优先考虑哪些功能或生成器类型?
它完全免费使用。期待听到你的想法!
1 分•作者: Wayve•6 个月前
我们需要一个扬声器分割解决方案,该方案能够在 iOS 和 macOS 上每隔几秒钟与转录同步运行。但原生 Swift 支持要么有限,要么受限于付费许可。由于扬声器分割是语音转文本工作流程中的常见需求,我们决定开源我们的工作成果,回馈社区。
我们最初尝试了 sherpa-onnx,它确实有效,但同时运行分割和转录模型会降低旧设备的运行速度。仅使用 CPU 进行推理对于接近实时的工作负载来说并不理想,因此我们希望能够将分割和说话人嵌入卸载到 GPU 或 ANE。特别是支持 M1 Mac 意味着将更多的工作负载推送到 ANE。
我们没有用 C++ 将 ONNX 模型硬塞进 CoreML,而是将原始 PyTorch 模型直接转换为 CoreML。这种方法需要在 PyTorch 和 pyannote 代码中进行一些修补,但初步的基准测试结果看起来很有希望。
我们非常欢迎反馈!我们目前正在努力添加 VAD 并集成 Parakeet 进行转录,但仍在努力解决 CoreML 模型转换问题。
1 分•作者: WaitWaitWha•6 个月前
1 分•作者: ksec•6 个月前
1 分•作者: Jon_Behrendt•6 个月前
1 分•作者: handfuloflight•6 个月前
1 分•作者: sandwichsphinx•6 个月前
1 分•作者: andsoitis•6 个月前
1 分•作者: reaperducer•6 个月前
2 分•作者: rglover•6 个月前
今天花了一天时间尝试设置这个,但没成功。想知道其他人有什么发现。看起来大家对支持的传输方式似乎意见不一,虽然我确实让 STDIO 传输方式工作了,但理想情况下,我希望使用 HTTP(S)(我只想部署一个独立的 MCP 服务器,可以接入聊天/应用程序等)。
据我所知,这东西太新了,很少有客户端真正支持流式 HTTP。SSE 替代方案也不是很清楚(而且显然已经被弃用了)。
是我太蠢了吗,还是这东西真的太前沿了,所以问题重重,让人困惑?答案五花八门,似乎只有 STDIO 才是稳定/可用的。
我尝试的一切都失败了。
19 分•作者: jmillikin•6 个月前
2 分•作者: ohjeez•6 个月前
1 分•作者: Brysonbw•6 个月前
1 分•作者: oopismcgoopis•6 个月前
OopisOS 并非一个网站,而是一个完全在您的机器上运行的操作系统模拟。它没有后端服务器。您创建的每个文件、添加的每个用户、运行的每个命令都会在本地处理和存储。您的世界完全属于您自己,由您控制的强大安全模型管理。
这个项目的开始源于一个疑问:一个复杂的、有状态的、多用户系统,是否可以用纯粹的 Web 原生工具构建?答案是响亮的“是”。OopisOS 是一个生动的演示,展示了当今浏览器功能与严谨的、无框架的架构相结合时,可能实现的可能性。
1 分•作者: Brysonbw•6 个月前
5 分•作者: trinsic2•6 个月前
1 分•作者: thunderbong•6 个月前