11作者: andrewsthoughts6 天前
大家好,我是 Zencoder 的创始人 Andrew。<p>在构建我们的 IDE 扩展和云端代理时,我们遇到了许多人在复杂代码库中使用编码代理时可能遇到的相同问题:代理陷入循环、道歉,并浪费时间。<p>我们尝试用脚本来管理这个问题,但同时处理终端窗口和复制粘贴提示非常痛苦。因此,我们构建了 Zenflow,一个免费的桌面工具,用于编排 AI 编码工作流程。<p>它处理了我们在标准聊天界面中缺失的功能:<p>跨模型验证:你可以让 Codex 审查 Claude 的代码,或者并行运行它们,看看哪个模型能更好地处理特定上下文。<p>并行执行:同时对待办事项运行五种不同的方法——将“人机结合”用于难题,将“YOLO”运行用于简单任务。<p>动态工作流程:通过简单的 .md 文件配置。代理实际上可以根据手头的问题动态地“重新连接”工作流程的后续步骤。<p>跨所有工作负载的项目列表/看板视图<p>我们从中学习到的<p>为了调整 Zenflow,我们在公共基准(SWE-Bench-*、T-Bench)和私有数据集上进行了 100 多次实验。以下是两个可能对社区感兴趣的主要发现:<p>基准饱和:模型在所有版本的 SWE-Bench(甚至 Pro)上都变得过度训练。我们发现公共结果与私有数据集上的性能差异很大。如果你正在构建工作流程,你不能依赖公共基准。<p>“金发姑娘”工作流程:在自主模式下,繁重的多步骤流程通常会增加错误而不是修复它们。庞大而复杂的提示模板在纸面上看起来不错,但在实践中却失败了。最可靠的设置落入一个狭窄的“金发姑娘”区域,即在不过度编排的情况下,拥有足够多的结构。<p>该应用程序可免费使用,并支持 Claude Code、Codex、Gemini 和 Zencoder。<p>我们一直在大量使用这个工具,但我很想听听你对默认工作流程的看法,以及它们是否符合你对代理编码的思维模型。<p>下载:<a href="https://zencoder.ai/zenflow" rel="nofollow">https://zencoder.ai/zenflow</a> YouTube 演示:<a href="https://www.youtube.com/watch?v=67Ai-klT-B8" rel="nofollow">https://www.youtube.com/watch?v=67Ai-klT-B8</a>
2作者: carlopi6 天前
DuckDB 表格可视化工具演示,展示“浏览器上的 Iceberg”演示 (<a href="https://duckdb.org/2025/12/16/iceberg-in-the-browser" rel="nofollow">https://duckdb.org/2025/12/16/iceberg-in-the-browser</a>)
7作者: lombarovic7 天前
Hi HN, 我在 2016 年底构建了 Drawize 的第一个版本,专门用于三星 Tizen 操作系统应用竞赛。我加班加点,在不到 4 周的时间里完成了整个项目(包括实时多人游戏引擎)。 它在比赛中一无所获。 由于它本来就是用 Web 技术构建的,我在 2017 年初将其发布到开放的 Web 上,只是为了看看会发生什么。它开始有了自己的生命,直到今天——8 年后——数据库处理了第 1 亿张绘画。 在最繁忙的日子里,它有超过 3 万活跃用户,目前存储 1 亿张绘画大约需要 3.16 TB。 里程碑时刻:我今天正在观看实时日志,害怕第 1 亿张绘画会是 NSFW 内容。幸运的是,RNG 之神露出了微笑,结果它是一只红气球 (你可以在这里看到第 1 亿张绘画:<a href="https:&#x2F;&#x2F;www.drawize.com&#x2F;blog&#x2F;100-million-drawings-milestone" rel="nofollow">https:&#x2F;&#x2F;www.drawize.com&#x2F;blog&#x2F;100-million-drawings-milestone</a>) 技术栈(无聊但快速): 后端:.NET + WebSockets(实时同步) 前端:手写 HTML/JS + jQuery(没有 React,没有打包器) 数据:PostgreSQL & MongoDB 存储:Wasabi Cloud(为了节省 S3 成本而迁移到那里) 作为一名独立开发者进行扩展:实时大厅 + 重新连接边缘情况 + 审核/内容过滤。我使用 2021 年训练的内容分类模型来过滤不良内容,并且实时多人游戏端主要是高度优化的 .NET 代码。 很乐意回答关于“失败”的 Tizen 起源、Web 上的实时多人游戏、审核或 .NET 如何处理负载的问题。
7作者: williamhaw7 天前
大家好,我是 Artie 的一名工程师,我们做实时数据复制。<p>我们当时在添加 MotherDuck 作为目标,第一个版本直接使用了 DuckDB 的 Go 驱动。它在我的机器上运行得很好……直到我们把它接入到我们的 Transfer 服务中(<a href="https://github.com/artie-labs/transfer" rel="nofollow">https://github.com/artie-labs/transfer</a>)。<p>由于该驱动需要 CGO,我们的 amd64 和 arm64 交叉编译开始失败,我们失去了易于使用的静态二进制文件,而且我们的 Docker 镜像不得不引入 C 工具链和系统库,仅仅是为了支持一个依赖项。我们尝试将 CGO 部分隔离到一个单独的模块中,但这仍然导致了 CI 失败,并迫使我们重写了构建流程的很大一部分。在那时,很明显我们不希望 CGO 出现在我们的主要服务中。<p>所以我构建了 ducktape:一个微小的独立微服务,它通过 HTTP/2 流封装了 DuckDB 的 Appender API。客户端通过 HTTP/2 流式传输 NDJSON,而 ducktape 则直接在另一端追加到 DuckDB 中。主代码库中没有 CGO,我们保持了跨平台、纯 Go 的构建方式。<p>在基准测试中,开销出人意料地低:通过 HTTP/2 约为 757 MiB/秒,而进程内约为 848 MiB/秒——大约是原生性能的 90%,但这是通过网络实现的。<p>ducktape 是开源的,并获得了 MIT 许可:<a href="https://github.com/artie-labs/ducktape" rel="nofollow">https://github.com/artie-labs/ducktape</a><p>我很乐意收到反馈,特别是如果您以不同的方式解决了 CGO 隔离问题,或者有想法可以榨取更多性能!
1作者: ZOdex7 天前
我正在构建一个封装器,它会查询 GPT-4、Claude 和 Gemini,然后在沙盒中执行它们的代码以捕捉幻觉。<p>30 秒的延迟换取确定性,这值得吗?还是你更喜欢速度?<p>我今天正在为人们进行手动测试,如果有人想尝试,请联系我。