7 分•作者: voxadam•大约 8 小时前
返回首页
一周热榜
6 分•作者: paladin314159•3 天前
6 分•作者: thunderbong•大约 3 小时前
6 分•作者: briancr•5 天前
我编写了一个轻量级的脚本语言,可以与 C 语言协同运行。具体来说,它是一个 C 库,你可以通过 C 函数调用来运行它,并且它能够回调你自己的 C 函数。编译后的体积约为 250 kB。除了 C 标准库之外,没有任何依赖项。
关键语言特性:
* 使用别名而非指针,因此内存安全
* 数组是 N 维且可调整大小的
* 运行脚本或其自己的“shell”
* 错误捕获
* 方法、继承等
* 可自定义语法
6 分•作者: andsoitis•大约 1 小时前
6 分•作者: crimsoneer•大约 16 小时前
嘿,HN!我上周参加了一个 ATProto 聚会,作为一个对学术出版深恶痛绝的、身心俱疲的半个学者,我觉得这可能是一个基于 Octopus(<a href="https://www.octopus.ac/" rel="nofollow">https://www.octopus.ac/</a>)构建一些有趣东西的机会,所以我周末有点兴奋,并构建了 Octosphere。
希望你们中的一些人觉得它有趣!博客文章在这里:<a href="https://andreasthinks.me/posts/octosphere/octosphere.html" rel="nofollow">https://andreasthinks.me/posts/octosphere/octosphere.html</a>
6 分•作者: stalfosknight•1 天前
6 分•作者: gentele•6 天前
6 分•作者: lcastricato•5 天前
在过去的几周里,世界模型开始首次展现出真实感。你可以看到连贯的环境、长时间的演变过程以及越来越逼真的视觉效果。与此同时,大多数此类系统难以运行、难以集成,并且为了规模而牺牲了交互性。
我们创建 Overworld 的初衷是,我们更关注于构建你可以真正进入的世界,而不是制作令人印象深刻的视频。这意味着低延迟、持续控制,以及每次你行动时都会响应的系统,而不是每条提示只响应一次。
上周,我们发布了 Waypoint 1,这是一个实时扩散世界模型的研发预览版,可在本地运行。下周,我们将发布 Waypoint 1.1 Small,它设计用于在现代消费级 GPU 上运行,并且易于构建和修改。
Waypoint 从头开始构建,而不是从大型视频模型进行微调。我们针对控制频率、稀疏注意力以及快速推理进行了大量优化,以便系统能够保持持久的世界状态,并以游戏级别的帧率响应输入。我们的目标是让开发者今天就可以集成它,而不仅仅是观看演示。
我们认为,一旦世界模型遵循与大型语言模型(LLM)类似的路径,即本地执行、开放工具和快速的社区驱动迭代,这个领域的发展速度将会最快。Genie 和类似的系统展示了大规模的可能性。我们的重点是让这个未来变得本地化和可访问。
我们在一篇最近的博文中详细阐述了“沉浸感差距”,为什么交互性比单纯的视觉效果更重要,以及我们如何优化模型。
代码、演示和发布详情请见:https://over.world/blog/the-immersion-gap
6 分•作者: bilsbie•1 天前
6 分•作者: item007•5 天前
大家好,我是来探讨一个想法的,很希望得到你们的反馈。<p>我是一个 Obsidian 的开发者和用户,正在验证一个名为“Concerns”的概念。目前它只是一个登陆页面和一份简短的调查(还没有产品),用于测试这个痛点是否真实存在。<p>核心理念(2-3点):<p>- 我们许多人会收集大量有用的信息(笔记/链接/文档),但这些信息很少能转化为实际成果。<p>- 我没有去改进“组织”(标签/文件夹),而是在探索一个“行动引擎”,它能:<p><pre><code> 1. 检测你当前的目标/正在进行的工作(“活跃项目”)
2. 在适当的时候呈现相关的已保存资料
3. 提出具体的下一步行动(最好是推送到你现有的任务工具中)
</code></pre>
我自己的“第二大脑”已经变成了一个充满良好愿望的墓地:组织带来的负担远大于我得到的回报。我正在尝试验证真正的瓶颈是执行,而不是收集。<p>在编写代码之前,我试图确定两件事:<p>- 项目上下文信号(代码库/PR?问题?任务?日历?一个“项目文档”?)<p>- 如何闭环:摄取知识 → 根据活跃项目进行排序 → 产生一小部分下一步行动到现有的待办事项工具中 → 从结果中学习(已完成/已忽略/已编辑),并选择性地写回最小状态。开放的问题是:在不产生噪音或隐私风险的情况下,什么是最好的反馈信号?(明确的评级 vs 完成事件 vs 基于文档的回写)<p>我希望你们能回答以下问题:<p>1. 你的“第二大脑”在哪里最容易崩溃?<p>收集 / 组织 / 检索 / 执行
(如果可以,请分享一个最近的具体例子。)<p>2. 如今,什么最能代表你的“活跃项目上下文”?<p><pre><code> 任务项目 (Todoist/Things/Reminders)
问题/看板 (GitHub/Linear/Jira)
文档/维基页面 (Notion/Docs)
日历
“在我的脑海里”
</code></pre>
你实际上会允许一个工具读取哪一个?<p>3. 对于一个从你的笔记/链接中建议行动的 AI,你坚决拒绝的是什么?(选择1-2项)<p><pre><code> 隐私/数据保留
嘈杂的建议/打扰
幻觉/错误的建议
工作流程改变/迁移成本
定价
其他</code></pre>
6 分•作者: ShreyaChaurasia•6 天前
Hi HN,
我们刚刚在 Flexprice 中发布了 Nomod 集成。
背景介绍:Flexprice 是一个开源的计费系统,处理发票、使用情况和信用钱包。我们希望弥补的一个不足是,在不破坏计费状态的情况下,支持特定地区的支付提供商。
通过这次集成:
* 在 Flexprice 中最终确定的发票可以同步到 Nomod
* 为发票生成托管的 Nomod 支付链接
* 支付状态更新会反馈到 Flexprice
* 发票和支付记录保持同步
* 信用额度(如果适用)仅在支付成功后应用
这简化了计费逻辑,避免了后续的对账问题。目前还没有演示,但文档已上线:[https://docs.flexprice.io/integrations/nomod/](https://docs.flexprice.io/integrations/nomod/)
欢迎大家提问,或者分享您在构建计费或支付集成方面的经验,也欢迎加入我们的开源社区:[http://bit.ly/4huvkDm](http://bit.ly/4huvkDm)
5 分•作者: mikece•5 天前
5 分•作者: g-mork•1 天前
5 分•作者: callmeed•7 天前
5 分•作者: souvik1997•5 天前
用于安全运行 LLM 生成代码的 WASM 沙盒。<p>智能体获得类似 Bash 的 shell,并且只能调用您提供的工具,以及您定义的约束。
无需 Docker,无需子进程,无需 SaaS — 只需 pip install amla-sandbox
5 分•作者: neuralkoi•7 天前
我最近创建了一个非营利组织,在通过 Google 非营利组织审批后,我尝试注册 Google Workspace。<p>我创建了一个帐户,但在登录时,它提示我输入电话号码以进行“额外安全验证”。输入我的手机号码后,我收到了消息:“此电话号码已被用于验证的次数过多。”<p>似乎除了获取一个新的电话号码外,没有任何其他方法可以解决这个问题。 无法联系到真人寻求支持。 从其他帐户(例如大学、工作)中删除我的手机号码似乎没有任何效果。<p>一个可怕的想法浮现在脑海:如果 Google 决定将我从他们的系统中踢出去,我就完蛋了。 我用它来做所有事情。<p>我怎样才能开始实际地“去 Google 化”自己?
5 分•作者: abdelhousni•3 天前
5 分•作者: abdelhousni•3 天前
5 分•作者: NBenkovich•1 天前
为了提高 AI 智能体的效率,我们需要构建与真实系统之间的反馈循环:部署、日志、配置、环境、仪表盘。<p>但问题就出在这里。<p>大多数现代应用程序没有细粒度的权限控制。<p>举个具体的例子:Vercel。如果我想让一个智能体读取日志或检查环境变量,我必须给它一个令牌,而这个令牌也允许它修改或删除东西。没有干净的只读或能力范围限定的访问权限。<p>这不仅仅是 Vercel 的问题。我在云仪表盘、CI/CD 系统和 SaaS API 中也看到了同样的模式,这些系统都是围绕着值得信赖的人类设计的,而不是自主智能体。<p>所以真正的问题是:<p>人们今天在生产环境中是如何限制 AI 智能体的?<p>你们是在构建强制执行策略的代理层吗?用白名单封装 API 吗?还是仅仅接受风险?<p>感觉我们正在试图将自主系统连接到从未为它们设计的基础设施上。<p>很想知道其他人是如何在实际环境中处理这个问题的,而不是停留在理论层面。