返回首页

一周热榜

1作者: killerstorm大约 15 小时前
“持续学习”被认为是大型语言模型(LLM)的“阻碍因素”之一:它们无法在工作中学习,也不会随着时间的推移而改进等等。特别是,Dwarkesh Patel将其描述为需要解决的一系列问题,才能实现通用人工智能(AGI)。 许多学术文章提出了针对LLM的某种记忆系统,这可以被认为是一种“持续学习”的形式。但大多数评估都侧重于记忆事实,而这并没有什么用处(通过工具使用来获取事实比将其存储在神经记忆中更好),而且这些提议可能不太适合常见的LLM API使用模式。 在本文中,我提出了一种“新”方法,称为“技能胶囊”,它非常实用,易于理解和评估,并且可能很好地集成到现有的工具中。 技能胶囊是一个具体对象——基本上是一堆向量。你可以将其插入到LLM上下文的中间某处,它可以提高特定技能的性能,例如,使工具调用更可靠,使用特定的写作风格、编码风格等。理论上,它可用于修补任何LLM的不足之处。一个胶囊可以包含知识(例如,如何调用特定的API或编写涉及特定库的代码)。 技能胶囊可以使用来自_单个示例_的单次前向传递来生成,不需要梯度或“微调”。因此,它可能允许LLM“在工作中学习”——即,只需一次演示如何正确执行某项操作,就可以用来创建一个胶囊。 你可能会问——为什么是“Show HN”而不是学术文章?因为研究人员已经知道这种方法——它被称为“软提示”、“超网络”、“转向向量”、前缀调优等。所有这些术语都很糟糕,并没有传达这种方法的可能性。我只是希望更多的人知道LLM可以即时改进。而一个更好的术语——“技能胶囊”——可能有助于人们思考如何应用这些技术(我希望如此)。 另一个是“Show HN”的原因是: ``` * 它表明人们可以在几天内使用Claude Code和花费几美元来支付GPU费用来完成一个很酷的ML实验 * 一个关于我如何到达那里的有点有趣的故事 ```
1作者: leethoe3 天前
技术,非技术;无聊或不无聊。我想摆脱目前这种 CRUD 软件工程师的工作,寻找一些更有意义的事情。
1作者: BSTRhino大约 3 小时前
这是我为期四天的游戏创作马拉松制作的游戏。这是一款关于拯救圣诞节的游戏,你不能让坏脾气的人毁掉所有的圣诞礼物。这些坏脾气的人会进行寻路,所以你可以在他们的路径上放置东西来减缓他们的速度,但他们最终会推开并突破障碍。这款游戏的核心在于如何在受到攻击时搭建最好的路障。希望你喜欢!
1作者: neotanp6 天前
大家好!我一直在开发一个希望能帮助开发者的东西:gameenginehub.com。这是一个简单的网站,旨在帮助你为下一个项目选择合适的游戏引擎。无论你正在考虑 Godot、Unity 还是 Unreal,我们都会提供比较、新闻和指南。<p><i>我为什么创建这个网站 选择正确的游戏引擎可能是一个巨大的难题。你应该选择 Unity 吗?它非常受欢迎,并且非常适合 2D 和 3D 游戏?或者,如果你需要强大的图形并希望制作大型游戏,Unreal 可能是更好的选择?也许你听说过 Godot——最近备受关注的开源引擎。<p>很难决定,对吧?我也有过这种经历。所以我决定创建 GameEngineHub,让这个过程更容易。<p></i>你将在网站上找到的内容 - 引擎比较:我们对 Godot、Unity、Unreal 和其他流行的引擎进行详细分析,帮助你确定哪个最适合你的项目。 - 新闻和更新:了解游戏引擎世界的最新趋势和变化。 - 指南和教程:学习如何开始使用每个引擎,并深入了解它们的运作方式。 - 社区反馈:我一直在寻找其他开发者的反馈。你如何评价这些引擎?你使用 Godot、Unity、Unreal 或任何其他游戏引擎的经验是什么?分享你的评分和评论,以帮助其他人做出更好的选择!<p><i>背后的故事 我创建这个网站是因为,当我开始的时候,我发现很难找到对不同游戏引擎的清晰、直接的比较。需要考虑的因素有很多——性能、平台支持、易用性——而且很快就会让人不知所措。 所以,我决定把我所学到的一切都放在一个地方。GameEngineHub 旨在为你提供快速、可靠的信息,以便你能够就使用哪个游戏引擎做出更明智的决定。<p></i>我很乐意听取你的想法 我仍在努力改进网站并使其更好。如果你有任何反馈、建议或想法,请随时分享!缺少什么?什么对你最有帮助?请告诉我!<p>访问 gameenginehub.com 了解更多信息
1作者: _steake大约 15 小时前
安全产业复合体兜售各种虚假的“氛围”。严重性徽章。仪式性的扫描。然后,在真相大白的那一刻,它拒绝了简单而成熟的问题:你真的能攻破它吗? Shannon 说了“是”。它做了不合时宜的事情:尝试利用漏洞,提供收据,或者闭嘴。没有漏洞利用,就没有报告。这句话抹杀了仪式感的一半,以及所有的迷信。 Shannon Uncontained 是为那些不需要容器来运行 Node,不总是有源代码,并且不效忠于任何单一 LLM 供应商的人准备的。它原生运行。它支持 Claude、GPT-4.1,支持通过 GitHub 模型连接,以及本地模型(Ollama/llama.cpp/LM Studio)。 当您只有 URL 和权限时,它会爬取、指纹识别并组装伪代码——一个结构化的路由、输入和流程模型——然后将其交给相同的“先利用后报告”的流程。少一些花哨的仪式,多一些实际的影响。 这是一个真正意义上的渗透测试工具: 如果它无法让漏洞奏效——shell,XSS 弹窗,身份验证绕过,SSRF 访问——它就不会将其记录为“真理”。 它将您的混乱映射到 OWASP Top 10,为审计人员输出 SARIF 格式,为人类输出 JSON/HTML 格式,并保留一个实际的证据审计跟踪,而不是一份忏悔。 它无需容器伪装即可融入 CI/CD,因为“便携式”不应该意味着“围绕 JavaScript 封装的假 Linux”。 是的,语气是具有对抗性的。那是因为默认状态是自满。“我们运行了扫描器”是一首摇篮曲。如果您的应用程序可以被攻破,您的流程应该在其他人发现之前就找到它。 如果您对伪代码的想法感到反感,太好了——请告诉我它在哪里失败了。如果您认为它有用,请告诉我您希望在 CI 中设置哪些安全措施(超时、范围限制、身份验证流程)。无论哪种方式,前提都成立:没有概念验证的怀疑,就像用 YAML 编写的占星术。 代码库:[https://github.com/steake/shannon-uncontained](https://github.com/steake/shannon-uncontained)