12作者: Genesis_rish6 个月前
大家好, 我一直在尝试对图像生成进行对抗性扰动,看看需要多大的失真才能阻止模型生成图像或使其偏离目标。这基本上没什么进展,这并不意外。 然后我尝试了一些更奇怪的事情:我没有对抗模型,而是试图推动它将上传的图像本身分类为 NSFW(不宜在工作场所观看),这样它最终会触发自己的安全防护。 结果证明这比预期的更有趣。它不一致,而且绝对不稳定,但在某些情况下,相对温和的变换就足以改变模型对原本良性图像的内部安全分类。 这与绕过安全措施无关,如果说有的话,它恰恰相反。我的想法是故意给安全层本身施加压力。我计划将其作为小型工具 + UI 开源,一旦我能使行为更稳定和可重复,主要是作为一种探测和预先过滤审核流程的方式。 如果它能可靠地工作,即使只是部分地,它至少可以提高那些喜欢滥用这些系统的人的成本。
1作者: oceanwaves6 个月前
我发布了 Formfactor,一个实用插件,用于观察传入 MIDI 的时序、活动和强度。除了原样传递原始 MIDI 模式之外,它还允许你复用多达八个额外的通道,用于输出经过塑形的、独立排序的 MIDI CC,以调制外部硬件或软件乐器。<p>我为自己构建了它,并喜欢用它来塑造和路由 Eurorack 调制,使其更具音乐性。<p>Formfactor 是免费的。支持 CLAP/VST3/AUv2
6作者: quarkcarbon2796 个月前
大家好,我是 Bhavani,来自 rtrvr.ai。<p>我们构建了 DOM 原生 Web 代理(不基于截图的视觉,不使用 CDP/Playwright 调试器端口控制)。我们原生处理验证码,包括 Google reCAPTCHA 图片挑战,通过遍历跨域 iframe 和 shadow DOM 实现。目前这方面的延迟较高。<p>问题在于:在调试图片选择验证码(例如“选择所有带有交通灯的图片”)时,日志不会告诉你代理为何点击了错误的图块。我经常盯着执行日志,心想“它真的正确地看到了网格吗?”然后意识到我只是想看着它工作。<p>所以我们构建了用于 Cloud Run 上无服务器 Chrome worker 的实时 VNC 视图 + 接管功能。<p>关键经验:<p>1. 会话亲和性是尽力而为的;“稍后附加”可能会命中不同的实例<p>2. 一个单独的中继服务,通过短时令牌将查看器↔运行器配对,使附加具有确定性<p>3. 运行器保持干净:并发=1,每个容器一个浏览器,没有混合流量<p>希望收到已经发布过类似产品的人的反馈:<p>1. 你们用什么替代了 VNC(WebRTC 等),为什么?<p>2. 在不占用大量存储空间的情况下,录制/回放的最佳方法是什么?<p>3. 你们如何在无服务器环境中安全地处理“稍后附加”?
1作者: xakpc6 个月前
最初,我以为通过 HTTP 暴露类似 dstp 的东西会很酷:一种通过 REST API 远程运行低级网络诊断的简单方法。后来我放弃了 dstp,用 .NET 重写了每个检查。然后我添加了显而易见的下一步——从不同的地理区域运行相同的检查,因为大多数真实的事件都不是本地的。我手头已经有几个服务器用于副业项目,所以很容易尝试。 在某个时候,我切换到完全的 grug-dev 模式,砍掉了所有不必要的东西。没有代理,没有设置,没有监控,没有账户。一个请求进来,从多个地方并行检查,返回原始结果。目标是,在发生事件时,你可以用 curl 命令调用它,并立即回答“这在任何地方都坏了吗,还是只是从这里坏了?” 还有一个开源的 sidecar,供希望自托管监控的人使用,但它仍然需要一些调整。 我还不完全确定下一步是什么,可能是一个小的付费层级来支付服务器成本和买杯咖啡,但目前,即使没有 API 密钥,公共 API 也有相当慷慨的限制,如果你想试用它的话。