最新

2 分•作者: elofgerde•9 个月前

目前，它就像是治疗“信息茧房”/无脑刷屏的尼古丁贴片。你仍然可以刷，但看到的内容更有意义。我的目标：用户标记他们感兴趣的内容（例如，人工智能、太空探索或其他），然后应用会抓取最新的科学文章、高质量的YouTube视频和播客，并以适合你的方式在一个漂亮的feed里呈现出来。目前：你可以搜索任何内容（例如“航海探险家”——> 应用程序会抓取维基百科或YouTube，并整合出一个简短的feed（例如，哥伦布、达·伽马等）。我正在使用RAG（检索增强生成）技术，这样我就可以随时引用原始数据来源（我认为这很关键）。无论来源如何，我都会从维基百科抓取图片。目前，这是最大的难题，因为每篇文章的图片质量和数量都有限——> 导致我的文章呈现效果不够好。非常希望得到一些反馈，特别是如果你经常浏览维基百科的话。

Launch HN: Halluminate (YC S25) – 推出 Halluminate (YC 夏季班 25) – 模拟互联网以训练计算机使用

12 分•作者: wujerry2000•9 个月前

大家好，我是 Jerry 和 Wyatt，来自 Halluminate (<a href="https://halluminate.ai/">https://halluminate.ai/</a>)。我们帮助 AI 实验室利用高质量数据和强化学习 (RL) 环境来训练计算机使用代理。训练 AI 代理使用计算机、浏览器和软件是 AI 领域最具潜力的机会之一。然而，到目前为止，这项能力仍然不稳定。目前，改进这种能力的新兴方法被称为“可验证奖励的强化学习”（RLVR）。但研究人员目前面临的瓶颈是缺乏高质量的模拟器以及任务和验证器。为了解决这个问题，我们正在构建 Westworld，一个完全模拟的互联网，由最常见的消费者和企业应用程序的合成版本组成。代理使用 Westworld 来学习如何执行具有经济价值的任务。例如，AI 代理可以在模拟的航班预订网站 (<a href="https://flights.halluminate.ai/">https://flights.halluminate.ai/</a>) 上练习规划度假，或者学习如何重新组织销售平台中的过时信息，或者训练直接在电子表格中进行财务建模。这里有一个演示，展示了我们的航班预订模拟：<a href="https://www.loom.com/share/74a3b28067e24c1b886054ba90a90aa5" rel="nofollow">https://www.loom.com/share/74a3b28067e24c1b886054ba90a90aa5</a>。工作原理：AI 代理访问我们的环境，并被赋予一个任务和验证器。任务基本上是代理要实现的目标，例如“帮我预订从旧金山到纽约的航班，日期是某年某月某日，并使用 x、y、z 筛选条件。” 验证器是一种程序化的方式，用于确定任务是否成功完成。例如，在这种情况下，它可能是一个 json 文件，用于检查最终的航班数据是否符合预期。然后，这些信号可以用于计算 RL 中的奖励。我们构建的模拟器越多，AI 实验室就能越好地改进计算机使用代理目前表现不佳的能力。我们的一个客户在使用我们的航班预订模拟器进行训练时，日期选择性能提高了约 20%。到目前为止，有两个因素使得这项工作变得困难：(1) 模拟必须是真实的。你不能满足于“80% 的解决方案”，因为即使是很小的差异也会影响性能。生成模拟数据甚至更难。例如，处理航班数据使其看起来真实需要大量的试验和实验。(2) 你训练代理的任务必须是精心挑选的。只有当它们反映了人们真正希望解决的工作时，它们才是有价值的。我们需要大量来自领域专家的反馈才能做到这一点。也就是说，我们发现这项工作非常有趣，并很高兴解决这些问题。我们近期内计划发布的一些令人兴奋的内容：- 通过将多个模拟器串联起来以实现扩展工作流程，从而能够训练长期任务；- 程序化数据生成。我们如何建模数据生成，以便在代理探索时程序化地填充我们的模拟器（类似于 Minecraft），而不是预先合成生成所有数据；- 开源！我们计划向公众发布我们的环境，以便开发人员/研究人员可以对其进行修改，用于自己的实验。RL 模拟器只是我们业务的一部分。另一部分是关于人类数据创建（类似于 Scale AI，但用于计算机使用）。我们为客户提供现成的预训练/微调数据集、专家级的人工评估/错误分析，或任何其他数据需求。这两者之间也有很多令人兴奋的重叠——例如，使用人类专家来帮助创建我们的模拟器/任务。很乐意详细介绍，但我们认为模拟器会成为更令人感兴趣的 HackerNews 帖子 :)最后，关于我们：Wyatt 和我是在康奈尔大学学习计算机科学时认识的，并且已经一起生活和工作了 7 年多。我之前在 Capital One Labs 领导产品/研究，在那里我推出了银行业务中最早的 AI 代理之一。Wyatt 之前是康奈尔 Milstein 学者，并为纽约市的两家早期创业公司做了大规模的数据工程。我们去年辞去了工作，并在为我们的客户（他们是浏览器/计算机使用代理公司）构建评估时亲身体验了这些问题。如果有人有任何问题、反馈或想法，请告诉我们！期待您的评论。

Show HN: 简历体检

2 分•作者: thatjoeoverthr•9 个月前

再见，GitHub——首席执行官辞职

67 分•作者: ben_hall•9 个月前

Show HN: 我开发了一个 AI 工具，用于寻找合适的投资者并实现融资自动化

1 分•作者: paulwilsonn•9 个月前

我开发了一个AI工具，旨在减轻创始人融资的痛苦。在我为自己的初创公司融资时，我花了几个月的时间建立名单、研究风投，并发送了石沉大海的冷邮件。这个工具可以完成繁重的工作：找到真正符合您所处阶段、行业和地域的投资者显示近期交易，让您了解他们的活跃程度自动化外展和跟进，或者让您导出名单目前还处于早期阶段——我很乐意听取其他创始人关于哪些功能有用、缺少什么以及如何让它真正帮助融资的反馈意见。

元泄密第一部分

2 分•作者: cowboyscott•9 个月前

告诉 HN：搜索你的项目，查找 "git://github.com"。任何匹配都意味着一个漏洞。

1 分•作者: XCabbage•9 个月前

如今许多开源项目都包含（通常在文档、代码注释或元数据中）类似这样的仓库 URL： ``` git://github.com/debug-js/debug.git ``` 这些 URL 已经失效。“git://” 确实是一个真实的协议，但在 2022 年，GitHub 停止了对其的支持 [1]，因此任何声称使用该协议访问 GitHub 仓库的 URL 都会失效。它们仍然很常见。在下载量排名前 200 的 npm 包中，有 25 个在其 package.json 文件的“repository”字段中包含此类 URL。如果能修复这些失效的 URL 就好了（只需将“git://”替换为“https://”即可轻松完成）。对于不了解 git 协议或 GitHub 禁用该协议的读者来说，这些 URL 很容易造成困惑。 [1] https://github.blog/security/application-security/improving-git-protocol-security-github/#no-more-unauthenticated-git

研究发现，气候变化正导致加拿大湖泊中藻类大量增生

1 分•作者: PaulHoule•9 个月前

生活真美好

1 分•作者: imsurajkadam•9 个月前

科学家制造出“超级钢”，或能将聚变推向新高度

1 分•作者: rbanffy•9 个月前

基于网关的定位

1 分•作者: hasheddan•9 个月前

美国联邦通信委员会提议对国家预警系统进行现代化改造

1 分•作者: impish9208•9 个月前

Linus Torvalds 称谷歌工程师编写的 RISC-V 代码是“垃圾”

3 分•作者: taubek•9 个月前