最新

突发奇想：如果 2003 年有人能在他们的机器上运行本地 LLM 会怎么样？XP 桌面，山坡壁纸，也许角落里还开着 Winamp——然后你就可以在本地和 AI 聊天了。我在 Reddit 上看到有人尝试过，所以我也试了一下。我从 macOS 交叉编译了 llama.cpp，目标是 Windows XP 64 位。主要障碍：将 cpp-httplib 降级到 v0.15.3（较新版本明确阻止了 Win8 之前的版本），用 XP 兼容的线程原语替换 SRWLOCK/CONDITION_VARIABLE，以及常见的 DLL 地狱。Qwen 2.5-0.5B 在适合那个年代的硬件上以大约每秒 2-8 个 token 的速度运行。速度不快，但它能工作。视频演示和构建说明在文章中。Claude 帮助解决了构建系统的大部分调试问题。我只是提供了那些有问题的“人生选择”。

ASCII 滑雪

1 分•作者: memalign•7 个月前

惊艳地图：蜜蜂地图

1 分•作者: altilunium•7 个月前

Show HN: AIDictation – 零数据留存听写应用

1 分•作者: vood•7 个月前

嗨 HN，我开发了 AIDictation.com，一个用 Swift 编写的语音转文本应用程序。它将音频发送到我自己的后端，通过基于 Whisper 的管道运行，并返回一个转录文本，然后您可以将其直接发送到 AI 聊天，如 ChatGPT 或 Claude。我构建全栈应用程序大约 20 年了，但这是我的第一个 Swift 应用程序。我严重依赖 AI 编码工具，在几周内从零 Swift 编程到开发出一个可用的应用程序和后端。它的功能录制音频并将其发送到我的服务器。后端使用 Whisper V3 Turbo + OpenAI GPT OSS 120B 运行一个管道。我特意选择了云端管道而不是设备端模型，这样我可以： - 在后端并行处理工作并调整管道。 - 混合搭配提供商和模型。 - 提高延迟，而无需发布新的应用程序版本。转录完成后，有一个“分享到 AI 聊天”流程，您可以一键将其发送到 ChatGPT、Claude 等。上下文规则我在 Whisper Flow 中错过的功能之一是可配置的上下文规则（类似于超级 Whisper 模式）。AIDictation 允许您根据您正在做的事情定义转录的行为方式。例如： - 会议：保留发言者姓名和时间戳。 - 编码：保留技术术语和代码格式。 - 日记：更宽容，添加标点符号，使文本更具可读性。 - 您可以配置不同的预设并在它们之间切换。为什么选择云端而不是设备端很多应用程序都专注于在本地运行模型。我选择了相反的权衡： - 提供商灵活性：目前我正在使用 Groq API，因为在我的测试中，它具有最佳的端到端延迟（700-800 毫秒），但后端构建用于交换提供商和模型。 - 这确实意味着音频会离开设备，所以我试图对数据处理非常明确。无需注册。您每月可以免费获得大约 2,000 个单词，无需创建帐户或提供电子邮件。技术栈客户端：Swift（我发布的第一个真正的 Swift/iOS 应用程序）。后端：Vercel 上的 NodeJS。模型：Whisper V3 Turbo + OpenAI GPT OSS 120B。提供商：目前是 Groq API，主要是出于延迟原因。在过去的几周里，我每天都在使用 AIDictation，到目前为止我对它很满意，但我真的希望从 HN 获得坦诚的反馈——关于产品和实施。

在人工智能时代，孩子们仍然需要学习编程

1 分•作者: victorbuilds•7 个月前

上一页 1...3102 3103 3104 3105 3106...5443 下一页