1 分•作者: alephnerd•大约 9 小时前
返回首页
最新
1 分•作者: coach-d•大约 9 小时前
2 分•作者: 0x1997•大约 9 小时前
3 分•作者: Brajeshwar•大约 9 小时前
1 分•作者: chaosprint•大约 9 小时前
2 分•作者: vaylian•大约 9 小时前
2 分•作者: stanlymt•大约 9 小时前
32 分•作者: Brajeshwar•大约 9 小时前
1 分•作者: InputNothing•大约 10 小时前
1 分•作者: flashbrew•大约 10 小时前
1 分•作者: andsoitis•大约 10 小时前
1 分•作者: keepamovin•大约 10 小时前
1 分•作者: sebg•大约 10 小时前
1 分•作者: Brajeshwar•大约 10 小时前
1 分•作者: Reformedot•大约 10 小时前
1 分•作者: consumer451•大约 10 小时前
1 分•作者: n1b0m•大约 10 小时前
1 分•作者: pseudolus•大约 10 小时前
3 分•作者: steadeepanda•大约 10 小时前
我想分享一个我最初为 OpenClaw 制作的解决方案,它有助于控制你的 AI 代理在无需影响其能力的情况下可以访问的内容。我希望它对你有所帮助。
基本上,该解决方案让你可以在安全边界内自由地试验你的代理。
它是有意设计的确定性系统(不包含任何 AI 层),这意味着该解决方案遵循清晰且已定义的规则,以最大限度地提高安全性/可靠性和可预测性。
这些规则经过了大量测试,用于检测提示注入尝试和其他安全案例(在文档中详细说明)。
所有内容都位于本地,并存储在你的计算机上,包括文档站点。
它为你提供了一个控制面板,用于监控和控制边界。当边界即将被突破时,你会收到一个批准请求,让你看到你的 openclaw 试图做什么。
它还(目前)支持 Tailscale,因此你可以连接你的 Tailscale IP 地址并在手机上接收所有内容,并且你可以正常聊天、批准或拒绝请求。它允许你通过你的 tailscale IP 地址(建议使用私有 IP 地址)从任何地方访问控制面板。目前仅支持 Telegram 频道。
目前仅支持 Linux 操作系统以及 Opencode Claude Code & OpenClaw 运行器。
开始所需的步骤在自述文件中进行了说明,其中还包括快速演示/展示图片,以便你可以了解它的外观。
我很乐意听取大家的反馈,特别是针对提示注入的测试,以了解它如何处理。如有任何问题,请随时在 GitHub 上开一个工单,我会尽力修复它们。
链接在这里:[https://github.com/steadeepanda/agent-ruler/](https://github.com/steadeepanda/agent-ruler/)
感谢你的阅读。我很乐意与你讨论。
28 分•作者: heresie-dabord•大约 10 小时前