1 分•作者: rajatmehra05•17 天前

一个无需 OAuth 即可获取 YouTube 字幕的 JavaScript/TypeScript 小型库。适用于索引、摘要和 AI 实验。欢迎反馈。

1 分•作者: technoir•17 天前

1 分•作者: randomwalker•17 天前

2 分•作者: seanlf•17 天前

一次运行中出现 42 个验证错误。Claude 道歉而不是编写 HTML。OAuth 令牌在中途过期。<p>然后我修复了约束。八天，零故障，零干预。<p>秘诀不在于更好的提示词……而在于将 LLM 视为一个受约束的函数：模式验证的工具调用会拒绝格式错误的输出并强制重试，两阶段架构将编辑判断与格式化分开，以及无聊的 DevOps（重试逻辑、速率限制、结构化日志记录）。<p>Claude 的调用在 2000 行的系统中大约有 30 行。大部分工作都在它周围。<p><a href="https://seanfloyd.dev/blog/llm-reliability" rel="nofollow">https://seanfloyd.dev/blog/llm-reliability</a> <a href="https://github.com/SeanLF/claude-rss-news-digest" rel="nofollow">https://github.com/SeanLF/claude-rss-news-digest</a>

Rust 中的参数化 CAD

49 分•作者: ecto•17 天前

时间站模拟器

17 分•作者: FriedPickles•17 天前

Show HN：首个自主机器学习与人工智能工程 Agent

2 分•作者: svij137•17 天前

我是创始人。我构建了 NEO，一个专为 AI 和 ML 工程工作流程设计的 AI 智能体，此前我反复在使用现有工具时遇到了同样的瓶颈：它们适用于短小、线性的任务，但一旦工作流程变得耗时、有状态且需要反馈驱动时，就会崩溃。在真实的机器学习工作中，你不仅仅是生成代码然后继续。你需要探索数据、训练模型、评估结果、调整假设、重新运行实验、比较指标、生成工件并迭代；这些过程通常需要数小时甚至数天。大多数现代编码智能体已经超越了单一提示。它们可以规划步骤、编写文件、运行命令并对错误做出反应。但问题仍然在于，当机器学习工作流程变得耗时且需要大量反馈时。训练任务、评估、重试、指标比较和部分失败仍然被视为短暂的副作用，而不是持久的状态。一旦一个工作流程跨越数小时、多个实验或迭代评估，你就要么一直盯着智能体，要么重启流程的大部分。反馈是存在的，但系统无法从中可靠地恢复。 NEO 试图按照实际发生的方式来模拟机器学习工作。它是一个执行端到端机器学习工作流程的 AI 智能体，而不仅仅是代码生成。工作被分解为具有状态、检查点和中间结果的明确执行步骤。来自指标、评估或失败的反馈直接反馈到下一步，而不是强制完全重启。你可以暂停运行，检查发生了什么，调整假设，并从中断的地方继续。这里有一个例子供你参考：你可能会要求 NEO 探索一个数据集，训练几个基线模型，比较它们的性能，并生成图表和一份简短的报告。NEO 将加载数据，运行 EDA，训练模型，评估它们，如果发现某些性能不佳或失败，则进行调整并继续。如果训练需要一个小时，并且一个模型在 45 分钟时崩溃，你不会从头开始。Neo 会检查失败原因，修复它，然后继续。扩展文档：[https://docs.heyneo.so/#/vscode](https://docs.heyneo.so/#/vscode) 很乐意回答关于 Neo 的问题。

Show HN：开源机器人——精选项目，附带交互式 3D URDF 查看器

2 分•作者: Tomas0413•17 天前

Show HN: PyTorch 分布式训练可观测性工具 (TraceML)

2 分•作者: traceml-ai•17 天前

Show HN：一款使用 SwiftUI 构建的 4.8MB 原生 iOS 语音备忘录应用

2 分•作者: karamalaskar•17 天前

嗨，HN，我想分享一个我一直在开发的项目，名为 Convoxa。它是一个原生 iOS 转录器/摘要器。我主要有两个目标：保持效率和保护隐私。技术栈 100% Swift & SwiftUI：没有繁重的跨平台封装器或臃肿的依赖项。二进制大小：最终构建包仅为 4.8 MB。转录：使用 Apple 最新的语音 API，以实现最大的隐私和效率。挑战：绕过 4K 上下文限制最大的技术障碍是使用 Apple 的基础模型。默认的上下文窗口限制为 4096 个 token，这对于超过 10 分钟的会议记录来说几乎无用。我最终构建了一种递归分块方法，可以在不丢失对话全局上下文的情况下“喂给”模型长篇数据。我使用滑动窗口方法，其中每个分块的摘要都会影响下一个分块，确保最终输出不会在分块连接处“幻觉”。它现在已经足够稳定，可以处理长篇音频，同时在支持的硬件上完全在设备端运行。隐私和 AI 模式设备端：（需要 Apple Intelligence）- 完全本地处理。云端：具有智能洞察力的推理（零数据保留）。我目前正处于预订阶段（2 月 3 日发布），希望从社区获得关于性能和分块逻辑的反馈。 App Store：<a href="https://apps.apple.com/us/app/convoxa-ai-meeting-minutes/id6755150446">https://apps.apple.com/us/app/convoxa-ai-meeting-minutes/id6...</a>

美国消费者信心跌至12年新低

1 分•作者: akyuu•17 天前

查克·克洛斯特曼谈论我们为何从未真正看过一场真实的橄榄球比赛

2 分•作者: proposal•17 天前

<a href="https://archive.is/mi308" rel="nofollow">https://archive.is/mi308</a>

卷积神经网络可视化

1 分•作者: auraham•17 天前

阿博特州长下令德州各大学和政府机构停止H-1B签证申请

1 分•作者: malshe•17 天前

人口普查局低估了企业对人工智能的采用情况

1 分•作者: gmays•17 天前

欧盟现在拥有自己的“安全加密”卫星通信系统