1 分•作者: ddesposito•6 个月前
返回首页
最新
1 分•作者: nreece•6 个月前
1 分•作者: thuum7•6 个月前
2 分•作者: don_searchcraft•6 个月前
1 分•作者: austinallegro•6 个月前
1 分•作者: benjaminwootton•6 个月前
1 分•作者: CafeRacer•6 个月前
1 分•作者: PaulHoule•6 个月前
1 分•作者: donohoe•6 个月前
1 分•作者: jkestner•6 个月前
1 分•作者: ecballer17•6 个月前
1 分•作者: sipsofchai•6 个月前
作为一个 xkcd 的铁杆粉丝,我一直很想知道大家最喜欢的 xkcd 漫画是哪一幅。所以,受到 Tom Scott 视频“寻找最好的东西”的启发,我尝试用 1v1 对战的形式来找出“最好”的漫画。<p>配对是完全随机的,并且使用 Elo 等级分系统来计算排行榜。
1 分•作者: thomassmith65•6 个月前
1 分•作者: Tecolino•6 个月前
这个小型网络应用允许你尝试基于共识的优化,这是一种无梯度、基于粒子的算法。
1 分•作者: kmdupree•6 个月前
2 分•作者: sagering•6 个月前
嗨 HN,
我开发了我的梦想 Chrome 截图扩展程序,名为“Schnippi”,它结合了我无法在其他任何扩展程序中找到的功能。
功能包括:
- 速度优化:减少捕捉和导出(下载/复制)截图的按键或点击次数。只需按一下键和点击一下,您就可以在剪贴板或下载文件夹中获得截图。
- 灵活的捕捉和选择:捕捉任何可见的 HTML 元素,并在元素层级中循环以优化您的选择。您还可以捕捉自由形状的矩形或整个视口。
- 包含源 URL:导出带有捕捉页面源 URL 的截图。
- 多种导出选项:复制到剪贴板或以各种格式下载。
- 缩放友好:与“放大”页面配合良好。
- 隐私优先:不会将您的截图上传到服务器或收集任何数据。
- 简洁的 UI:中性和极简的图形用户界面。
它完全免费!您可以在这里试用:[https://chromewebstore.google.com/detail/schnippi-screenshot-tool/bnihkhiedonaoadigfljpjojncpnkeln](https://chromewebstore.google.com/detail/schnippi-screenshot-tool/bnihkhiedonaoadigfljpjojncpnkeln)
为什么截图很棒:
- 速度:除非是原始文本,否则截取截图通常是从网站上捕获信息或数据的最快方式。
- 上下文:截图可以提供关于捕获数据的基本上下文。
- 通用格式:大多数文字处理器、笔记应用程序、电子邮件客户端、LLM 聊天和搜索引擎都支持图像输入。
Schnippi 解决的问题:
仅使用 PNG 文件截图的一个问题是,会丢失一条重要信息:捕获页面的 URL。这就像没有来源的引用。没有页面 URL 的截图通常没有多大价值,因为您无法轻松返回页面以验证信息或了解更多上下文。
为了解决这个问题,Schnippi 允许您“复制为 HTML”,其中包括捕获页面的 URL 和图像 PNG。许多应用程序都支持这种格式,包括 Google Docs、Gmail、Apple Notes、Pages、Microsoft OneNote 和 Word 等。
我如何使用 Schnippi:
- 用于任何类型的研究或为项目收集视觉灵感。
- 截取数据图表的截图与同事分享。使用“复制为 HTML”,我不需要单独复制页面链接。
- 捕获截图并将其从剪贴板复制到搜索引擎/llm 聊天。
- 记录一条信息,包括源 URL。
下一步是什么:
我计划添加使用文本和形状(如箭头、矩形或圆形)注释截图的选项。
我很乐意听取您的反馈!
谢谢!
9 分•作者: dmazin•6 个月前
1 分•作者: embit•6 个月前
1 分•作者: draismaa•6 个月前
在传统软件开发中,我们编写单元测试来在回归问题影响用户之前发现它们。但在人工智能系统,尤其是那些具有自主行为的系统(agentic systems)中,这种方法会失效。你可以测试输入和输出,使用评估指标,但智能体(agents)是在时间维度上运作的,它们跨越工具、多重上下文、API,并接受不可预测的用户输入。其失效模式并不明显,通常只在边缘情况下才会显现。我注意到一种新兴实践:智能体模拟——结构化、可重复的场景,用于测试人工智能智能体在复杂或长尾情况下的行为。
思考一下:
* 如果上游工具在执行过程中发生故障会怎样?
* 如果用户在对话中途改变意图会怎样?
* 如果智能体的假设出现细微错误会怎样?
从自动驾驶汽车到人工智能智能体,都是如此吗?
上述情况并非一次性测试。它们就像自动驾驶汽车的模拟:受控环境,用于探索失效边界。自动驾驶汽车团队很久以前就认识到,现实世界的数据是不够的。最罕见的事件也最重要——你需要系统地生成和重放它们。同样的“长尾分布”也适用于大型语言模型智能体。我们已经开始将场景测试作为开发循环的核心部分——对模拟进行版本控制,在持续集成(CI)中运行它们,并随着智能体行为的变化而不断改进。这并非追求完美的覆盖率,而是将“事后测试”转变为“通过模拟进行测试”,作为迭代智能体开发的一部分。
好奇这里是否有人也在做类似的事情。除了几个提示和指标之外,你们是如何测试智能体的?很想听听Hacker News社区对智能体可靠性和安全性的看法——不仅是在研究中,也在实际部署中。
1 分•作者: taiseiue•6 个月前
想在现有的 OIDC 兼容应用中使用 Discord 身份验证吗?discord-oidc-proxy 是一个无服务器解决方案,它将 Discord 的 OAuth2 转换为符合标准的 OpenID Connect (OIDC) 提供商。运行在 Cloudflare Workers 上。
(我应该让它也支持 Docker 吗?我在等你的意见。)
我在我的编程项目中实现了 DI(依赖注入)!
功能:
- 通过标准的 OIDC 流程使用 Discord 身份验证
- 无服务器设计,运行在 Cloudflare Workers 上
- 使用 Hono 框架构建的轻量级实现
- 完整的 OIDC 发现支持 (/.well-known/openid-configuration)