1 分•作者: brandon_bot•大约 7 小时前
返回首页
一周热榜
1 分•作者: mikhael•大约 7 小时前
1 分•作者: ibobev•大约 7 小时前
1 分•作者: breve•大约 7 小时前
1 分•作者: gandalfgeek•大约 7 小时前
1 分•作者: fanf2•大约 7 小时前
1 分•作者: ikbdsk•大约 7 小时前
1 分•作者: killerstorm•大约 7 小时前
“持续学习”被认为是大型语言模型(LLM)的“阻碍因素”之一:它们无法在工作中学习,也不会随着时间的推移而改进等等。特别是,Dwarkesh Patel将其描述为需要解决的一系列问题,才能实现通用人工智能(AGI)。
许多学术文章提出了针对LLM的某种记忆系统,这可以被认为是一种“持续学习”的形式。但大多数评估都侧重于记忆事实,而这并没有什么用处(通过工具使用来获取事实比将其存储在神经记忆中更好),而且这些提议可能不太适合常见的LLM API使用模式。
在本文中,我提出了一种“新”方法,称为“技能胶囊”,它非常实用,易于理解和评估,并且可能很好地集成到现有的工具中。
技能胶囊是一个具体对象——基本上是一堆向量。你可以将其插入到LLM上下文的中间某处,它可以提高特定技能的性能,例如,使工具调用更可靠,使用特定的写作风格、编码风格等。理论上,它可用于修补任何LLM的不足之处。一个胶囊可以包含知识(例如,如何调用特定的API或编写涉及特定库的代码)。
技能胶囊可以使用来自_单个示例_的单次前向传递来生成,不需要梯度或“微调”。因此,它可能允许LLM“在工作中学习”——即,只需一次演示如何正确执行某项操作,就可以用来创建一个胶囊。
你可能会问——为什么是“Show HN”而不是学术文章?因为研究人员已经知道这种方法——它被称为“软提示”、“超网络”、“转向向量”、前缀调优等。所有这些术语都很糟糕,并没有传达这种方法的可能性。我只是希望更多的人知道LLM可以即时改进。而一个更好的术语——“技能胶囊”——可能有助于人们思考如何应用这些技术(我希望如此)。
另一个是“Show HN”的原因是:
```
* 它表明人们可以在几天内使用Claude Code和花费几美元来支付GPU费用来完成一个很酷的ML实验
* 一个关于我如何到达那里的有点有趣的故事
```
1 分•作者: Bayram•大约 7 小时前
1 分•作者: zdw•大约 7 小时前
1 分•作者: gnabgib•大约 7 小时前
1 分•作者: gnabgib•大约 6 小时前
1 分•作者: _steake•大约 6 小时前
安全产业复合体兜售各种虚假的“氛围”。严重性徽章。仪式性的扫描。然后,在真相大白的那一刻,它拒绝了简单而成熟的问题:你真的能攻破它吗?
Shannon 说了“是”。它做了不合时宜的事情:尝试利用漏洞,提供收据,或者闭嘴。没有漏洞利用,就没有报告。这句话抹杀了仪式感的一半,以及所有的迷信。
Shannon Uncontained 是为那些不需要容器来运行 Node,不总是有源代码,并且不效忠于任何单一 LLM 供应商的人准备的。它原生运行。它支持 Claude、GPT-4.1,支持通过 GitHub 模型连接,以及本地模型(Ollama/llama.cpp/LM Studio)。
当您只有 URL 和权限时,它会爬取、指纹识别并组装伪代码——一个结构化的路由、输入和流程模型——然后将其交给相同的“先利用后报告”的流程。少一些花哨的仪式,多一些实际的影响。
这是一个真正意义上的渗透测试工具:
如果它无法让漏洞奏效——shell,XSS 弹窗,身份验证绕过,SSRF 访问——它就不会将其记录为“真理”。
它将您的混乱映射到 OWASP Top 10,为审计人员输出 SARIF 格式,为人类输出 JSON/HTML 格式,并保留一个实际的证据审计跟踪,而不是一份忏悔。
它无需容器伪装即可融入 CI/CD,因为“便携式”不应该意味着“围绕 JavaScript 封装的假 Linux”。
是的,语气是具有对抗性的。那是因为默认状态是自满。“我们运行了扫描器”是一首摇篮曲。如果您的应用程序可以被攻破,您的流程应该在其他人发现之前就找到它。
如果您对伪代码的想法感到反感,太好了——请告诉我它在哪里失败了。如果您认为它有用,请告诉我您希望在 CI 中设置哪些安全措施(超时、范围限制、身份验证流程)。无论哪种方式,前提都成立:没有概念验证的怀疑,就像用 YAML 编写的占星术。
代码库:[https://github.com/steake/shannon-uncontained](https://github.com/steake/shannon-uncontained)
1 分•作者: rbanffy•大约 6 小时前
1 分•作者: rbanffy•大约 6 小时前
1 分•作者: nobody9999•大约 6 小时前
1 分•作者: sawirricardo•大约 6 小时前
1 分•作者: austinallegro•大约 6 小时前
1 分•作者: geox•大约 5 小时前
1 分•作者: SilverElfin•大约 5 小时前