1作者: sixhobbits18 天前
今天 Claude Code 两次停下来问了我一个问题,然后自问自答,仿佛是我问的,接着就继续了。<p>当我问它为什么这么做时,它说它没这么做。<p>这只是随机现象,还是最近其他人也遇到了类似情况?我用了好几个月,而且使用频率很高,但之前没见过这种情况。<p>https://x.com/sixhobbits/status/2016128163500151162?s=20
1作者: spacemule18 天前
几周前,我几乎不会用 Python 编程,而且一行 Go 代码都不会写。在看到 Claude 令人印象深刻地处理一个工作项目后,我决定尝试用它来教我编程。我让它搭建项目框架,在函数上方写上待办事项,并告诉我一个合理的开发顺序。这并不能教会软件设计,但它确实帮助我克服了学习生态系统和标准库的障碍。 现在,我仍然不能独立编程,但我已经足够自信地阅读别人的代码,甚至可能提交一个小的 PR 来修复一个 bug。 这是我第一次尝试一个通用的实用项目。它是一个变异准入 Webhook。这仍然是一个进行中的项目,但它正在运行,并且我正在自己的 k3s 集群上使用它。它将 oauth2-proxy 添加到需要身份验证的 Pod 中。在集群上,我用 Zitadel 替换了 Authentik,我需要一些东西来填补 Authentik 代理提供商的角色。 由于现在有这么多人使用 AI 并对其感到沮丧,我希望这可以激励大家将 AI 用作学习新事物的工具,而不是将其用作助手。希望这里更有经验的程序员能告诉我这个项目看起来像什么(我猜它肯定有很多不足)。我担心如果我继续这样下去,我会学得太像 Claude 编程了。
1作者: Tanziro18 天前
Hi HN, 我开发了 EchoEntry (<a href="https:&#x2F;&#x2F;echoentry.ai" rel="nofollow">https:&#x2F;&#x2F;echoentry.ai</a>) – 这是一个专门针对数字优化的语音转文本 API。 问题:通用的 STT API 在处理数字时表现不佳。“One oh five”有时会被转录成“105”,有时又变成“15”。对于医疗保健应用、仓库系统或 IVR 来说,这种不一致会破坏工作流程。 我的解决方案:在 1-999 的数字上对 Whisper-small 模型进行了微调,涵盖了 5 种英语口音。在 1-3 位数字上,准确率达到 95%。 技术栈: - 自定义 Whisper 模型 (1.7GB) - FastAPI 后端 - 部署在 8GB Linode 上 - FFmpeg 用于音频处理 立即试用(两个命令,无需注册): # 下载测试音频 curl -O <a href="https:&#x2F;&#x2F;echoentry.ai&#x2F;test_audio.wav" rel="nofollow">https:&#x2F;&#x2F;echoentry.ai&#x2F;test_audio.wav</a> # 测试 API curl -X POST <a href="https:&#x2F;&#x2F;api.echoentry.ai&#x2F;v1&#x2F;transcribe" rel="nofollow">https:&#x2F;&#x2F;api.echoentry.ai&#x2F;v1&#x2F;transcribe</a> \ -H &quot;X-Api-Key: demo_key_12345&quot; \ -F &quot;file=@test_audio.wav;type=audio&#x2F;wav&quot; 目前是免费 Beta 版(每个密钥每月 1,000 次调用)。 正在征求以下方面的反馈: 1. 什么样的准确率门槛能让您认为它适合投入生产? 2. 我是否遗漏了其他需要大量处理数字的用例? 3. 您是否愿意为它付费,而不是使用通用的 STT? 文档:<a href="https:&#x2F;&#x2F;echoentry.ai&#x2F;docs.html" rel="nofollow">https:&#x2F;&#x2F;echoentry.ai&#x2F;docs.html</a> 欢迎就微调过程或部署方面提出技术问题!
1作者: ClipNoteBook18 天前
我用 Reddit 很久了,注意到对相似帖子的反应很不一致。有时候我会收到积极的反馈和点赞,有时候却会收到很多负面回复,而且没有明显的解释。用了 Reddit 两年,我仍然不理解 Reddit 用户的想法,也不明白这些反应背后的心理机制。
1作者: iCeGaming18 天前
大家好, 我开发了 llm-schema-guard,因为 LLM 在生成 JSON 方面非常出色……直到它们突然不行。即使使用 JSON 模式或函数调用,你仍然会遇到字段缺失、类型错误,或者纯粹是语法错误,这些都会搞垮你的代理、RAG 流程,或者任何工具调用设置。 这是一个轻量级的 Rust HTTP 代理,位于任何与 OpenAI 兼容的 API(比如 Ollama、vLLM、LocalAI、OpenAI 本身、Groq,等等)的前面。它会获取生成的输出,根据你提供的 JSON Schema 进行检查,并且只有在有效的情况下才会放行。 如果无效,严格模式会返回一个干净的 400 错误,并附带详细信息。宽松模式会尝试通过使用修复指令和指数退避来调整提示,并重试几次。 其他一切都保持不变:完全支持流式传输(它会缓冲响应以进行验证),Prometheus 指标,以便你可以监控验证失败、重试、延迟等。配置使用简单的 YAML 文件,用于上游服务、每个模型的模式、速率限制、缓存等。甚至还有一个离线 CLI,如果你只想在本地测试模式。 它使用 Axum 和 Tokio 构建,以实现极低的延迟和高吞吐量,并在底层使用了 jsonschema-rs。Docker compose 使其可以非常简单地与 Ollama 一起启动。 这个项目源于我之前的 schema-gateway 项目,如果大家觉得有用,我很乐意添加 Anthropic 支持、工具调用验证或更好的流式修复等功能。 欢迎点赞或贡献! 感谢你的关注 :)
23作者: abkt18 天前
我想学习汇编语言,以便在 Apple II 上制作游戏。有哪些关于学习 6502 汇编语言和 Apple II 本身(内存、屏幕管理)的旧书?在学习汇编语言之前,是否绝对有必要先学习 BASIC?