1作者: sipsofchai6 个月前
作为一个 xkcd 的铁杆粉丝,我一直很想知道大家最喜欢的 xkcd 漫画是哪一幅。所以,受到 Tom Scott 视频“寻找最好的东西”的启发,我尝试用 1v1 对战的形式来找出“最好”的漫画。<p>配对是完全随机的,并且使用 Elo 等级分系统来计算排行榜。
2作者: sagering6 个月前
嗨 HN, 我开发了我的梦想 Chrome 截图扩展程序,名为“Schnippi”,它结合了我无法在其他任何扩展程序中找到的功能。 功能包括: - 速度优化:减少捕捉和导出(下载/复制)截图的按键或点击次数。只需按一下键和点击一下,您就可以在剪贴板或下载文件夹中获得截图。 - 灵活的捕捉和选择:捕捉任何可见的 HTML 元素,并在元素层级中循环以优化您的选择。您还可以捕捉自由形状的矩形或整个视口。 - 包含源 URL:导出带有捕捉页面源 URL 的截图。 - 多种导出选项:复制到剪贴板或以各种格式下载。 - 缩放友好:与“放大”页面配合良好。 - 隐私优先:不会将您的截图上传到服务器或收集任何数据。 - 简洁的 UI:中性和极简的图形用户界面。 它完全免费!您可以在这里试用:[https://chromewebstore.google.com/detail/schnippi-screenshot-tool/bnihkhiedonaoadigfljpjojncpnkeln](https://chromewebstore.google.com/detail/schnippi-screenshot-tool/bnihkhiedonaoadigfljpjojncpnkeln) 为什么截图很棒: - 速度:除非是原始文本,否则截取截图通常是从网站上捕获信息或数据的最快方式。 - 上下文:截图可以提供关于捕获数据的基本上下文。 - 通用格式:大多数文字处理器、笔记应用程序、电子邮件客户端、LLM 聊天和搜索引擎都支持图像输入。 Schnippi 解决的问题: 仅使用 PNG 文件截图的一个问题是,会丢失一条重要信息:捕获页面的 URL。这就像没有来源的引用。没有页面 URL 的截图通常没有多大价值,因为您无法轻松返回页面以验证信息或了解更多上下文。 为了解决这个问题,Schnippi 允许您“复制为 HTML”,其中包括捕获页面的 URL 和图像 PNG。许多应用程序都支持这种格式,包括 Google Docs、Gmail、Apple Notes、Pages、Microsoft OneNote 和 Word 等。 我如何使用 Schnippi: - 用于任何类型的研究或为项目收集视觉灵感。 - 截取数据图表的截图与同事分享。使用“复制为 HTML”,我不需要单独复制页面链接。 - 捕获截图并将其从剪贴板复制到搜索引擎/llm 聊天。 - 记录一条信息,包括源 URL。 下一步是什么: 我计划添加使用文本和形状(如箭头、矩形或圆形)注释截图的选项。 我很乐意听取您的反馈! 谢谢!
1作者: draismaa6 个月前
在传统软件开发中,我们编写单元测试来在回归问题影响用户之前发现它们。但在人工智能系统,尤其是那些具有自主行为的系统(agentic systems)中,这种方法会失效。你可以测试输入和输出,使用评估指标,但智能体(agents)是在时间维度上运作的,它们跨越工具、多重上下文、API,并接受不可预测的用户输入。其失效模式并不明显,通常只在边缘情况下才会显现。我注意到一种新兴实践:智能体模拟——结构化、可重复的场景,用于测试人工智能智能体在复杂或长尾情况下的行为。 思考一下: * 如果上游工具在执行过程中发生故障会怎样? * 如果用户在对话中途改变意图会怎样? * 如果智能体的假设出现细微错误会怎样? 从自动驾驶汽车到人工智能智能体,都是如此吗? 上述情况并非一次性测试。它们就像自动驾驶汽车的模拟:受控环境,用于探索失效边界。自动驾驶汽车团队很久以前就认识到,现实世界的数据是不够的。最罕见的事件也最重要——你需要系统地生成和重放它们。同样的“长尾分布”也适用于大型语言模型智能体。我们已经开始将场景测试作为开发循环的核心部分——对模拟进行版本控制,在持续集成(CI)中运行它们,并随着智能体行为的变化而不断改进。这并非追求完美的覆盖率,而是将“事后测试”转变为“通过模拟进行测试”,作为迭代智能体开发的一部分。 好奇这里是否有人也在做类似的事情。除了几个提示和指标之外,你们是如何测试智能体的?很想听听Hacker News社区对智能体可靠性和安全性的看法——不仅是在研究中,也在实际部署中。
1作者: taiseiue6 个月前
想在现有的 OIDC 兼容应用中使用 Discord 身份验证吗?discord-oidc-proxy 是一个无服务器解决方案,它将 Discord 的 OAuth2 转换为符合标准的 OpenID Connect (OIDC) 提供商。运行在 Cloudflare Workers 上。 (我应该让它也支持 Docker 吗?我在等你的意见。) 我在我的编程项目中实现了 DI(依赖注入)! 功能: - 通过标准的 OIDC 流程使用 Discord 身份验证 - 无服务器设计,运行在 Cloudflare Workers 上 - 使用 Hono 框架构建的轻量级实现 - 完整的 OIDC 发现支持 (/.well-known/openid-configuration)