85作者: vinni26 个月前
相关链接:<a href="https:&#x2F;&#x2F;xcancel.com&#x2F;vmfunc&#x2F;status&#x2F;2003292986650853825" rel="nofollow">https:&#x2F;&#x2F;xcancel.com&#x2F;vmfunc&#x2F;status&#x2F;2003292986650853825</a><p><a href="https:&#x2F;&#x2F;old.reddit.com&#x2F;r&#x2F;law&#x2F;comments&#x2F;1ptlms6&#x2F;some_epstein_files_can_be_unredacted&#x2F;" rel="nofollow">https:&#x2F;&#x2F;old.reddit.com&#x2F;r&#x2F;law&#x2F;comments&#x2F;1ptlms6&#x2F;some_epstein_f...</a><p><a href="https:&#x2F;&#x2F;krassencast.com&#x2F;p&#x2F;breaking-we-just-unredacted-the-epstein" rel="nofollow">https:&#x2F;&#x2F;krassencast.com&#x2F;p&#x2F;breaking-we-just-unredacted-the-ep...</a>
1作者: ProbDashAI6 个月前
Hi HN, 和许多人一样,我对发布的爱泼斯坦/麦克斯韦尔法庭文件大多是扫描图像(PDF)且没有文本层感到很沮丧。这使得它们无法使用Ctrl+F搜索或进行程序化分析。 我使用Python、Tesseract和OpenSearch构建了一个管道来解决这个问题。 网站:<a href="https:&#x2F;&#x2F;epsteinfilez.com" rel="nofollow">https:&#x2F;&#x2F;epsteinfilez.com</a> 技术栈: 摄取:Python worker使用ocrmypdf(Tesseract)对原始文件执行并行OCR。 搜索:OpenSearch用于索引提取的文本。 前端:Next.js (SSR) 用于UI。 基础设施:自托管Docker swarm。 功能: 在约15,000页中实现亚秒级的全文搜索。 直接在PDF页面上高亮显示搜索词。 深度链接到特定页面/文档。 这是一个透明度工具,而非政治工具。我希望让研究人员和记者能够访问原始的第一手资料。 欢迎提供关于搜索相关性或索引管道的反馈!
4作者: ediblepython6 个月前
1作者: yoan92246 个月前
我之前每个月花 200 美元在一个收入为 0 的副业项目上做数据分析。然后我花了 2 个小时试图在 GA4 中配置一个简单的漏斗,最终决定自己搭建一个。<p>Prysm 正是我希望存在的东西:<p><pre><code> - 访客位置的实时 3D 地球仪(Three.js + WebGL 着色器) - 3.8kb 的追踪脚本,而 GA 是 45kb – 原生 JS,零依赖 - 无 Cookie / 指纹识别 – 无需同意横幅 - AI 聊天,用于提问(“为什么流量激增?”) - 自动时间线:首位客户、收入目标、流量事件 </code></pre> 有趣的部分: - 将追踪脚本保持在 200 行以内,同时处理 SPA、离线模式、自定义事件 - 使用 GPT-4o-mini 进行简单查询,将成本控制在 9 美元 / 客户 / 月 - 为地球仪构建连接池(最多 5 个并发连接,以避免压垮 Supabase Realtime)<p>技术栈:Next.js, Supabase, Mapbox, OpenAI 定价:9.99–29.99 美元 / 月,面向独立黑客<p>现已开启内测。什么原因会让你最终从你目前的数据分析工具切换过来?
5作者: avipeltz6 个月前
大家好,我们是 Avi、Kiet 和 Satya。我们正在构建 Superset,一个开源终端,用于并行管理大量编码代理(Claude Code、Codex 等)。 * Superset 可以轻松创建 git 工作树并自动设置您的环境 * 代理和终端标签页与工作树隔离,防止冲突 * 内置钩子 \[0],用于在您的编码代理完成/需要关注时通知您 * 一个差异查看器,用于查看更改并快速创建 PR 我们是三位工程师,曾构建和维护大型代码库,并且一直希望尽可能并行地处理尽可能多的功能。Git 工作树 \[1] 对于此任务来说是一个有用的解决方案,但它们启动和管理起来很麻烦。我们开始构建 Superset,作为一个使用我们发现的并行运行代理的最佳实践的工具。 这是一个演示视频: [https://www.youtube.com/watch?v=pHJhKFX2S-4](https://www.youtube.com/watch?v=pHJhKFX2S-4) 我们都使用 Superset 来构建 Superset,它使我们的生产力翻了一倍以上(您可以通过自动更新看出来)。我们有很多朋友使用它来代替他们选择的 IDE 或用 Superset 替换他们的终端,并且它似乎很受欢迎,因为他们可以继续使用他们想要的任何 CLI 代理或工具,而 Superset 只是增强了他们现有的工具集。 Superset 主要用 Typescript 编写,基于 Electron、xterm.js 和 node-pty。我们选择 xterm+node-pty 是因为它是在桌面应用程序中运行真实 PTY 的一种经过验证的方法(由 VSCode 和 Hyper 使用),而 Electron 让我们能够快速发布。 接下来,我们正在探索一些功能,例如在云 VM 中运行工作树以释放本地资源、代理之间的上下文共享,以及一个顶级的编排代理,用于同时管理多个工作树或项目。 在构建过程中,我们学到了很多东西:制作一个好的终端比你想象的要复杂,而且终端和 git 的默认设置并非通用(svn 与 git、奇怪的 shell 设置、复杂的多仓库等)。 为自己构建产品会更快,而且非常有趣。目前还处于早期阶段,但我们希望您在所有 CLI 工具和环境中尝试 Superset,我们欢迎您的反馈!:) \[0] [https://code.claude.com/docs/en/hooks](https://code.claude.com/docs/en/hooks) \[1] [https://git-scm.com/docs/git-worktree](https://git-scm.com/docs/git-worktree)