1作者: audreymplatta18 个月前
Hi HN! 我开发了 Lockbridge,因为在 2025 年,安全的文件共享和加密工作流程仍然过于复杂。 Lockbridge 致力于使端到端加密传输变得简单、可审计且与云无关。 核心功能: * 桥接:可共享的、加密的上传/下载链接,具有自动过期功能。 * 云联盟:用于 S3、Azure、GCP、Google Drive、Dropbox 和其他与 S3 兼容的解决方案的统一仪表板。 * 区块链审计跟踪(可选):基于 Polygon 的不可变日志,用于 HIPAA/SOX 合规性。 * 零知识加密:真正的客户端 E2EE - 我们无法访问或解密您的文件。 示例用例: 创建一个桥接,将链接发送给客户,他们可以直接将文件安全地上传到您的 Google Drive、S3 或 Dropbox。桥接自动过期(例如,24 小时或 1 周)。对于受监管的行业,每次传输都可以选择记录到 Polygon,以获得不可变的合规性记录。 我们目前处于 Beta 测试阶段,希望收到关于以下方面的反馈: * 桥接 UX - 感觉直观吗? * 多云集成体验。 * 区块链审计跟踪是否在受监管领域之外增加了实际价值。 [http://lockbridge.com](http://lockbridge.com) 感谢您的任何想法、问题或您认为我们应该考虑的边缘情况。
2作者: hedayet8 个月前
我对训练 AI 模型(计算、能源、数据等)的成本随时间的变化很感兴趣。 是否有公开资源或数据集跟踪开源模型的训练成本(我猜这些数据很难获取,对于闭源模型来说,但如果我错了,我很乐意被纠正。) 我特别想了解哪些架构上的变化(例如,注意力机制变体、参数共享、混合专家模型)导致了主要的成本优化,而且不仅仅来自这些模型背后的公司,还包括任何训练或复现过这些模型的人。
4作者: Rutledge8 个月前
嘿,Hacker News!我曾在 Waymo 负责构建自动驾驶模拟和评估系统。现在,我正在开发 Scorecard,旨在将这种方法应用于智能体评估:为 AI 提供可复现的、自动化的评分。Scorecard 让你能够: * 在智能体工作流程上运行 LLM 裁判评估:在 CI/CD 或游乐场中测试工具使用、多步推理和任务完成情况。 * 使用 OpenTelemetry 追踪调试失败:查看哪个工具失败了,你的智能体为什么陷入循环,以及推理在哪里出错。 * 协作处理数据集、模拟智能体和评估指标。 立即试用 → [https://app.scorecard.io](https://app.scorecard.io)(免费套餐,无需付费!) 文档 → [https://docs.scorecard.io](https://docs.scorecard.io) 我们是一个小型团队(4 人),刚刚融资 375 万美元,并且已经有早期客户在使用 Scorecard 进行法律科技领域的评估。 我们的使命是消灭非确定性错误。你见过最奇怪的 LLM 输出是什么?