2作者: johnsillings7 个月前
嘿,HN! 纯粹出于好玩,我构建了一个交互式的 Hacker News 模拟器。 你可以像在真正的 HN 上一样提交文本帖子和链接。但在 HN 模拟器上,所有的评论都是由 LLM 生成的,并且即时生成。 我认为使用它的最佳方式是提交一个文本帖子或一个可使用 curl 命令的 URL 到这里:<a href="https:&#x2F;&#x2F;news.ysimulator.run&#x2F;submit" rel="nofollow">https:&#x2F;&#x2F;news.ysimulator.run&#x2F;submit</a>。你不需要账号就可以发帖。 当你这样做时,各种提示将从评论者原型、情绪和风格的库中构建。AI 评论者实际上会回复你的文本帖子和/或提交的链接。 我真的希望它感觉真实,而且我认为这个项目基本实现了这一点。在开发过程中,我一直混淆哪个标签是“真正的” HN,哪个是模拟器,并且不小心向 HN 提交了一些垃圾。(抱歉 dang 和团队——我清理了)。 这个应用程序本身是用 Node + Express + Postgres 构建的,所有的推理都在 Replicate 上运行。 说到 Replicate,他们慷慨地为我提供了免费的推理积分——所以要感谢那里的团队。 这个应用程序在技术上最有趣的部分是评论是如何运作的。你可以在这里阅读更多关于它的信息,以及探索所有可用的原型、情绪和风格,这些都会被组合成提示:<a href="https:&#x2F;&#x2F;news.ysimulator.run&#x2F;comments.html" rel="nofollow">https:&#x2F;&#x2F;news.ysimulator.run&#x2F;comments.html</a> 我希望你们玩得开心,就像我制作它一样!
161作者: bilsbie7 个月前
<a href="https://xcancel.com/karpathy/status/1993010584175141038" rel="nofollow">https://xcancel.com/karpathy/status/1993010584175141038</a>
7作者: leo_e7 个月前
我们遇到了一个经典的分布式系统难题,正在寻找相关的经验教训或“最不坏”的实践方法。 背景:我们维护一个分布式有状态引擎(类似于搜索/分析)。架构是标准的:一个控制平面(协调器)将数据段分配给工作节点。工作负载涉及大量使用 mmap 和延迟加载大型数据集。 事件:我们发生了一次级联故障,协调器陷入循环,对特定节点进行了 DDOS 攻击。 信号:协调器发现节点 A 的行数(逻辑计数)明显低于集群平均值。它将节点 A 标记为“未充分利用”。 行动:协调器尝试重新平衡/将新数据段加载到节点 A 上。 现实:节点 A 实际上占用了 197GB 内存(接近 OOM)。节点 A 上的数据恰好非常宽(胖行,巨大的 blob),因此其逻辑行数较低,但物理占用空间巨大。 循环:节点 A 拒绝加载(或超时)。协调器忽略了背压,再次看到较低的行数,并立即重试。 核心问题:我们试图为负载均衡器编写一个“上帝公式”。我们从 row_count 开始,但失败了。我们考虑了磁盘使用情况,但由于延迟加载,这与内存(RAM)不相关。 现在我们正在研究 mmap。由于操作系统管理页面缓存,应用程序级别的 RSS 具有噪声,并且不能严格反映“所需”内存与“可回收”缓存。 问题:试图将每个资源变量(CPU、IOPS、RSS、磁盘、逻辑计数)枚举到一个单一的评分函数中,感觉像是一个 NP-hard 陷阱。 在内存使用情况不透明/动态的系统中,您如何处理放置问题? 愚蠢的协调器,智能节点:我们是否应该让协调器基于磁盘空间盲目地进行分配,并 100% 依赖节点根据本地压力返回硬 429 Too Many Requests 错误? 成本估算:我们是否尝试为每个数据段构建一个合成的“成本模型”(例如,预测的内存占用),并根据信用进行调度,忽略实际的操作系统指标? 控制平面解耦:将存储平衡(磁盘)与查询平衡(内存)分开? 感觉我们正在重复造轮子。欢迎提供论文或类似架构事后分析的参考资料。
1作者: robot_jackie7 个月前
Corvus Robotics 正在扩大有史以来最大的自主物流数据采集车队规模。如果你对含铅焊锡、实际收入、电子表格或模棱两可的事情过敏——这个职位不适合你。多一些“纸箱”,少一些“派力肯箱”。 我们的飞行仓库无人机车队将在 2026 年增长 5 倍,我正在寻找一位在旧金山湾区的前创始人或制造领导者,他们希望亲自动手,大规模扩大在美国和海外的制造运营。 我们需要一位从事过硬件产品(不仅仅是 SaaS)工作、沟通清晰且具有不懈进取精神的人。如果精通普通话,并带领产品通过 EVT/DVT/PVT 阶段,将是一个额外的加分项。 如果这引起了你的共鸣,请私信我,或发送一封非常简短的电子邮件至 a@ 我们的网址,内容包括: - 你感兴趣的原因 - 你从哪个最大的制造事故中恢复过来 - 你的目标薪酬 PS - 请转发我们的 LinkedIn 帖子! [https://www.linkedin.com/posts/mhkabirr_at-corvus-robotics-were-scaling-the-largest-activity-7397916377002500096-WiLm](https://www.linkedin.com/posts/mhkabirr_at-corvus-robotics-were-scaling-the-largest-activity-7397916377002500096-WiLm) 谢谢, Jackie
2作者: sanaf7 个月前
Hi HN, 我搭建了 GhostBin,一个轻量级的 pastebin,旨在取代 ix.io 等服务曾经提供的简洁性和速度。ix.io 已经宕机很久了,而现有的 pastebin 大多臃肿、缓慢,或者不便于命令行操作。我需要一个“开箱即用”的极简工具,尤其是在调试或撰写内容时用于管道传输日志和命令输出。所以,我做了自己的。 GhostBin 专注于: 简洁性:干净的界面和直观的 API。 性能:使用 Go + Redis 实现快速读写。 CLI 优先的工作流程:curl 和 shell 管道开箱即用。 隐私和控制:支持 Docker 自托管;无供应商锁定。 阅后即焚 + 过期:适用于临时代码片段。 可选删除密钥:允许通过 API 安全删除。 演示:https://www.youtube.com/shorts/RINJI_Q5048 源代码:https://github.com/0x30c4/GhostBin CLI 脚本:https://raw.githubusercontent.com/0x30c4/GhostBin/main/gbin.sh ``` $ curl -F "f=@file.txt" gbin.me ``` ``` dmesg | curl -F "f=@-" gbin.me ```
1作者: pharshal7 个月前
ProDisco 为 AI 智能体提供了 Kubernetes 访问权限,其实现方式与 Anthropic 的渐进式披露模式 [1] 类似:MCP 服务器提供搜索工具,进而呈现 TypeScript 模块,智能体通过发现这些模块来编写代码,最终只有控制台输出会返回给智能体。 ProDisco 更进一步:它没有暴露自定义的 TypeScript 模块,而是提供了一个结构化的参数搜索工具,该工具可以从官方 Kubernetes 客户端库中返回最合适的方法,包括其输入和返回值的类型定义。这使得智能体能够动态地与上游 Kubernetes 库交互,同时避免了在该存储库中镜像或封装这些 API 带来的持续维护负担。 [1] <a href="https:&#x2F;&#x2F;www.anthropic.com&#x2F;engineering&#x2F;code-execution-with-mcp" rel="nofollow">https:&#x2F;&#x2F;www.anthropic.com&#x2F;engineering&#x2F;code-execution-with-mc...</a>
1作者: azdle7 个月前
这是我过去几个月一直在做的一个小项目。它是一个服务,通过静态 HTTP 端点托管 Lua 脚本。这是我为了满足自己的需求而构建的,现在我正在推出一个免费的公开测试版,看看是否也有其他人觉得它有用。 &lt;背景故事&gt; 我的第一份专业工作是在一家构建工业物联网平台的公司,该公司最独特的功能是他们基于 Lua 的脚本平台。我最终非常喜欢 Lua,以至于在我的下一份工作,在 SmartThings,我最终成为了主要推动者,促成了基于 Lua 的 Edge Drivers 的出现,当时我们被迫停止使用旧的基于 Groovy 的 DTH,编写了最初的 PoC,规划了架构,并编写了系统的核心。 这基本上是我对 2017 年倒闭的一个名为 webscript.io 的旧服务的看法,这是另一个让我爱上 Lua 的工具。我大量使用了该服务,用于个人项目和工作中的小工具。当它关闭时我真的很伤心,而且我真的认为没有哪一个星期我没有希望它仍然存在。所以,我最终决定我需要构建自己的版本。 &lt;/背景故事&gt; Bodge 的整个理念是让拼凑东西尽可能简单。我一直有很多想做的小型 side project,但这些项目不值得为了实际将它们组合在一起并保持维护而产生的开销。所以,我构建了 Bodge,以便在灵感来袭时,让每个单独的项目都减少工作量。到目前为止,我构建了: * 一个用于一些拼凑的物联网设备的当前时间 API:<a href="https://time.bodge.app/" rel="nofollow">https://time.bodge.app/</a> * 一个为我妻子编写的脚本,用于检查她的通勤时间,并在情况变糟之前给她发送电子邮件。 * 如果我的 Matrix 服务器宕机,会向我自己发送电子邮件通知。 * 一个“随机选择一个东西”页面。<a href="https://rand.bodge.app/choose?head&amp;tails" rel="nofollow">https://rand.bodge.app/choose?head&amp;tails</a> * 一个“工作”电话号码语音信箱,脚本将 webhook 转换为向我自己的警报。 * 只要有新版本发布,就会向我自己发送电子邮件通知,用于一些半公开的自托管服务。 * 几个公司的职位列表的抓取器,只要有新职位发布并匹配某些筛选条件,就会通知我。 * 一个 WebPush 服务器,我最终想用它来向我自己发送自定义通知。 * 一个 SVG 访问计数器,&lt;<a href="https://hits.bodge.link/" rel="nofollow">https://hits.bodge.link/</a>&gt;,纯粹是为了好玩。 脚本可以像这样简单: ```lua return "Hello, world!" ``` 或者,只要你愿意,它们可以变得多么复杂,只要在一个 Lua 文件中即可。 目前,我提供了 Lua 模块,用于:发出 HTTP 请求、处理 json、向自己发送警报、简单的字符串/字符串键/值存储、跨脚本互斥锁以及其他一些基本功能。 帐户是免费的,但即使您不想注册帐户,也可以随意编写脚本。主页上有一个演示,让您可以自己运行真实的脚本,尽管有一些额外的限制。 我很乐意听取大家的意见!