1作者: Epif7 个月前
关键在于值得开发的理念,理念越好,回报越大。免费成为我的技能伙伴。
1作者: kaifcodec7 个月前
扫描用户名在多个社交、开发者和创作者平台上的可用性。非常适合在一个命令中查找 GitHub、Twitter、Reddit、Instagram、Telegram 等平台的唯一用户名。 代码库:https://github.com/kaifcodec/user-scanner.git
1作者: dandinu7 个月前
突发奇想:如果 2003 年有人能在他们的机器上运行本地 LLM 会怎么样?XP 桌面,山坡壁纸,也许角落里还开着 Winamp——然后你就可以在本地和 AI 聊天了。<p>我在 Reddit 上看到有人尝试过,所以我也试了一下。<p>我从 macOS 交叉编译了 llama.cpp,目标是 Windows XP 64 位。主要障碍:将 cpp-httplib 降级到 v0.15.3(较新版本明确阻止了 Win8 之前的版本),用 XP 兼容的线程原语替换 SRWLOCK/CONDITION_VARIABLE,以及常见的 DLL 地狱。<p>Qwen 2.5-0.5B 在适合那个年代的硬件上以大约每秒 2-8 个 token 的速度运行。速度不快,但它能工作。<p>视频演示和构建说明在文章中。<p>Claude 帮助解决了构建系统的大部分调试问题。我只是提供了那些有问题的“人生选择”。
1作者: vood7 个月前
嗨 HN, 我开发了 AIDictation.com,一个用 Swift 编写的语音转文本应用程序。它将音频发送到我自己的后端,通过基于 Whisper 的管道运行,并返回一个转录文本,然后您可以将其直接发送到 AI 聊天,如 ChatGPT 或 Claude。 我构建全栈应用程序大约 20 年了,但这是我的第一个 Swift 应用程序。我严重依赖 AI 编码工具,在几周内从零 Swift 编程到开发出一个可用的应用程序和后端。 它的功能 录制音频并将其发送到我的服务器。 后端使用 Whisper V3 Turbo + OpenAI GPT OSS 120B 运行一个管道。 我特意选择了云端管道而不是设备端模型,这样我可以: - 在后端并行处理工作并调整管道。 - 混合搭配提供商和模型。 - 提高延迟,而无需发布新的应用程序版本。 转录完成后,有一个“分享到 AI 聊天”流程,您可以一键将其发送到 ChatGPT、Claude 等。 上下文规则 我在 Whisper Flow 中错过的功能之一是可配置的上下文规则(类似于超级 Whisper 模式)。AIDictation 允许您根据您正在做的事情定义转录的行为方式。 例如: - 会议:保留发言者姓名和时间戳。 - 编码:保留技术术语和代码格式。 - 日记:更宽容,添加标点符号,使文本更具可读性。 - 您可以配置不同的预设并在它们之间切换。 为什么选择云端而不是设备端 很多应用程序都专注于在本地运行模型。我选择了相反的权衡: - 提供商灵活性:目前我正在使用 Groq API,因为在我的测试中,它具有最佳的端到端延迟(700-800 毫秒),但后端构建用于交换提供商和模型。 - 这确实意味着音频会离开设备,所以我试图对数据处理非常明确。 无需注册。您每月可以免费获得大约 2,000 个单词,无需创建帐户或提供电子邮件。 技术栈 客户端:Swift(我发布的第一个真正的 Swift/iOS 应用程序)。 后端:Vercel 上的 NodeJS。 模型:Whisper V3 Turbo + OpenAI GPT OSS 120B。 提供商:目前是 Groq API,主要是出于延迟原因。 在过去的几周里,我每天都在使用 AIDictation,到目前为止我对它很满意,但我真的希望从 HN 获得坦诚的反馈——关于产品和实施。