3作者: seng7 个月前
我的团队找到我:“我们没法估算这个项目。我们不了解这个系统是怎么运作的。” 我们接手了一个有十年历史的 Yii2 代码库。之前有两个团队尝试过对其进行现代化改造,但都失败了。代码遵循了正确的模式——ORM、胖模型、MVC——但一个功能会涉及到 8 个层中的 40 多个文件。最初的开发者已经离开了。文档还是 2019 年的。 Cursor 和 Claude Code 也无能为力。它们在处理单个文件方面很出色,但它们无法看到功能是如何在数百个文件中相互关联的。上下文窗口有限。会话之间没有记忆。 所以,我用“氛围编码”的方式解决了这个问题。我不是专业的开发者——只是创始人迫于无奈。 18 个月后,它变成了 CodeCompass: * 将功能映射到分散的代码 * 追踪跨层的逻辑 * 在几秒钟内回答“X 是如何工作的?” * 为 AI 助手提供持续的上下文 已开源。我接触的每个企业都有同样的问题。 [https://pearlthoughts.com/codecompass](https://pearlthoughts.com/codecompass)
2作者: bjourne7 个月前
欧盟和美国都已在机场引入面部扫描,以“提高安全”。欧盟的规定目前更为严格,而美国的规定允许一些对此感到不适的人选择不参与。但这只是一个时间问题,最终它将成为对所有人的事实上的强制要求。他们声称数据不会被保留或与其他方共享。是啊,没错,我完全相信……对此能做些什么吗?我确信很少有顾客认为面部扫描是一种改进。
2作者: vlejd7 个月前
要从稀疏性中获益,通常需要使用非常稀疏的矩阵,对稀疏模式施加一些结构,或者拥有专门的硬件。如果你想在消费级设备上运行剪枝后的 LLM,以上这些都不适用。 我想看看在 GPU 上能把它推到什么程度,最终得到了这个结果。 博客:<a href="https:&#x2F;&#x2F;www.grizzlytech.dev&#x2F;blog&#x2F;macko-spmv" rel="nofollow">https:&#x2F;&#x2F;www.grizzlytech.dev&#x2F;blog&#x2F;macko-spmv</a> 论文:<a href="https:&#x2F;&#x2F;arxiv.org&#x2F;abs&#x2F;2511.13061" rel="nofollow">https:&#x2F;&#x2F;arxiv.org&#x2F;abs&#x2F;2511.13061</a> 代码(使用 torch 的示例):<a href="https:&#x2F;&#x2F;github.com&#x2F;vlejd&#x2F;macko_spmv" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;vlejd&#x2F;macko_spmv</a>
2作者: 539hex7 个月前
我构建了一个开源恶意软件检测守护程序,它使用机器学习和启发式方法实时监控所有正在运行的进程。无需内核模块或 eBPF。<p>要点:<p>- 轮询 /proc 获取新进程(适用于任何 Linux 内核 2.6+)<p>- 在 EMBER 2018 数据集(230 万个样本)上训练的随机森林模型<p>- 针对加密矿工、勒索软件、Rootkit 的启发式规则<p>- 约 20MB 内存,&lt;1% CPU 占用率,亚毫秒级扫描延迟<p>- 纯 C 语言编写,零运行时依赖<p>- 模型直接嵌入二进制文件中(50KB)<p>我为什么构建它:<p>现有的解决方案要么需要现代内核(eBPF),要么过于臃肿/专有。我想要一个轻量级的,可以在任何地方运行的——服务器、容器、旧发行版。<p>检测方法:<p>从可执行文件中提取特征(熵、导入、节),运行机器学习预测,应用启发式规则,合并得分。如果超过阈值,则终止进程。<p>欢迎讨论实现细节或一般的 Linux 安全问题。