最新

大家好，我想分享一下 Okapi 的早期预览版，它是一个内存指标引擎，同时也与现有的数据湖集成。现代软件系统会产生海量的遥测数据。虽然我们可以讨论这是否必要，但我们都同意这种情况确实存在。如今，大多数指标引擎使用专有格式来存储数据，并且不使用分离的存储和计算。Okapi 通过利用开放数据格式并与现有数据湖集成来改变这一点。这使得可以使用 Snowflake、Databricks、DuckDB 甚至 Jupyter / Polars 等标准 OLAP 工具来运行分析工作流程（例如异常检测），同时避免两种方式的供应商锁定——您可以自带工作流程并拥有可替换的计算引擎。分离还减少了维护您自己的存储的运维负担，并且可以根据需要扩展和缩减计算引擎。然而，并非所有数据都可以驻留在数据湖/对象存储中——这不适用于最近的数据。为了简化实时查询，Okapi 首先将所有指标数据写入内存存储，并从该存储中读取最近的数据。指标在到达时会被汇总，这有助于缓解内存压力。指标会在内存中保留一段可配置的保留期，之后它会被导出到对象存储/数据湖（目前仅支持 Parquet 导出）。这允许对最近的数据进行快速读取，同时卸载对较旧数据的查询处理。在基准测试中，对内存数据的查询在不到一毫秒的时间内完成，同时具有每秒约 28 万个样本的写入吞吐量。在实际部署中，会有网络延迟，因此具体情况因人而异。 Okapi 仍处于早期阶段——欢迎反馈、批评和贡献。谢谢！

Show HN: Anchor Relay – 一种更快、更简单的获取 Let's Encrypt 证书的方式

7 分•作者: geemus•9 个月前

从晦涩难懂的终端命令到无数种“搬起石头砸自己的脚”的方式，我一直对使用 TLS 证书感到头疼。我喜欢 Let's Encrypt 让获取证书变得多么容易（而且便宜），但仍然有很多事情需要费心。这就是我们构建 Relay 的原因：一个免费的、基于浏览器的工具，它简化了 ACME 工作流程，特别是对于家庭实验室等棘手的设置。Relay 充当您的 ACME 客户端和公共证书颁发机构（如 Let's Encrypt）之间的安全中介。Relay 提供更好体验的一些方式：<pre><code> - 几分钟内即可获得真正快速、简化的证书，适用于任何 ACME 客户端 - 一次性预先 DNS 委托，无需入站流量或散落在各处的 DNS 凭据 - 清晰地了解整个 ACME 流程和续订提醒 </code></pre> 立即试用 Relay：<a href="https://anchor.dev/relay" rel="nofollow">https://anchor.dev/relay</a>或者阅读我们的博文：<a href="https://anchor.dev/blog/lets-get-your-homelab-https-certified" rel="nofollow">https://anchor.dev/blog/lets-get-your-homelab-https-certifie...</a>请试用一下（只需几分钟），并告诉我您的想法。

Show HN: Luminal – 开源、基于搜索的 GPU 编译器

24 分•作者: jafioti•9 个月前

大家好，我是 Joe。我和我的朋友 Matthew、Jake 正在构建 Luminal (<a href="https://luminalai.com/">https://luminalai.com/</a>)，这是一个 GPU 编译器，用于为 AI 模型自动生成快速的 GPU 内核。它使用基于搜索的编译来实现高性能。我们接受高级模型代码，就像你在 PyTorch 中看到的那样，并生成非常快的 GPU 代码。我们这样做没有使用 LLM 或 AI，而是将其视为一个搜索问题。我们的编译器构建一个搜索空间，生成数百万个可能的内核，然后搜索它以最小化运行时。你可以在 mac 上的 `demos/matmul` 中试用演示，看看 Luminal 如何获取一个简单的操作（用我们由 12 个简单操作组成的 IR 表示），并将其编译成优化的、支持张量核心的 Metal 内核。这里有一个视频展示了如何操作：<a href="https://youtu.be/P2oNR8zxSAA" rel="nofollow">https://youtu.be/P2oNR8zxSAA</a> 我们的方法与传统的 ML 库有很大不同，因为我们提前编译所有内容，生成一个大型的逻辑等效内核搜索空间，并搜索它以找到最快的内核。这使我们能够利用“苦涩的教训”来完全自动地发现复杂的优化，例如 Flash Attention，而无需手动启发式方法。最好的规则就是没有规则，最好的启发式方法就是没有启发式方法，只需搜索一切。我们正在努力使 CUDA 支持与 Metal 持平，为搜索空间增加更多灵活性，添加完整的模型示例（如 Llama），并添加非常奇特的硬件后端。我们的目标是彻底简化 ML 生态系统，同时提高性能和硬件利用率。请查看我们的代码库：<a href="https://github.com/luminal-ai/luminal" rel="nofollow">https://github.com/luminal-ai/luminal</a>，我很乐意听取你的想法！

使用 ColPali 的多格式 RAG：PDF、图像、幻灯片 – 无需 OCR

1 分•作者: badmonster•9 个月前

Show HN：如果 Google Scholar 和 ChatGPT 结合会怎样？[视频]

1 分•作者: ieuanking•9 个月前

嗨，HN！大型 AI 在帮助学生方面总是差强人意。学习模式和现有的聊天机器人并不能强化或培养将信息转化为知识的批判性思维能力。与 ChatGPT 或传统的聊天机器人不同，我们专注于阅读、笔记和引用 + 你可以使用 @[项目名称]（类似于光标）进行引用、笔记和归档。设想：Google Scholar + ChatGPT + AI 突出显示工具 = Fiig 我们现有的用户喜爱 Fiig，因为它提供了资源密集型和内容驱动的体验。Fiig 让你能够访问庞大的学术资源库，或者你可以整合你上传的文件，进行全面、个性化的研究。快速搜索多个学术数据库中的相关论文和研究。上传并索引你的 PDF 文档。AI 驱动的搜索结果相关性排序。按出版日期、作者或期刊进行筛选。秘诀在于：我们强大的 AI 注释工具。Fiig 可以在任何上传或找到的 PDF 中精确到行地进行高亮显示。这对于草稿修订、收集引言、快速浏览来源非常有帮助。当与 PDF 聊天时，Fiig 会在上下文中锁定在已添加 PDF 中的信息，从而最大限度地减少幻觉，并且随着你做笔记和互动，对你需求的上下文感知能力会显著增强。今天就试试 Fiig 吧 -- www.ubik.studio 欢迎并鼓励提供反馈。我们正在开发 EVALS 和一个应用程序。很快会更新！(我们只是一个两人团队，有太多事情要做，哈哈)

埃隆·马斯克的无聊公司正在拉斯维加斯地下掘进，几乎没有监管

1 分•作者: barbazoo•9 个月前

亚马逊计划在 Fire 平板电脑的更新换代中放弃自研的 Android 软件。

1 分•作者: c420•9 个月前

上一页 1...4095 4096 4097 4098 4099...4955 下一页