1 分•作者: vinipolicena•6 个月前
返回首页
最新
1 分•作者: bookofjoe•6 个月前
1 分•作者: paulpauper•6 个月前
2 分•作者: paulpauper•6 个月前
1 分•作者: paulpauper•6 个月前
2 分•作者: sathvikchinnu•6 个月前
85 分•作者: vinni2•6 个月前
相关链接:<a href="https://xcancel.com/vmfunc/status/2003292986650853825" rel="nofollow">https://xcancel.com/vmfunc/status/2003292986650853825</a><p><a href="https://old.reddit.com/r/law/comments/1ptlms6/some_epstein_files_can_be_unredacted/" rel="nofollow">https://old.reddit.com/r/law/comments/1ptlms6/some_epstein_f...</a><p><a href="https://krassencast.com/p/breaking-we-just-unredacted-the-epstein" rel="nofollow">https://krassencast.com/p/breaking-we-just-unredacted-the-ep...</a>
1 分•作者: agajews•6 个月前
2 分•作者: faebi•6 个月前
1 分•作者: mooreds•6 个月前
1 分•作者: maxmax_•6 个月前
1 分•作者: ProbDashAI•6 个月前
Hi HN,
和许多人一样,我对发布的爱泼斯坦/麦克斯韦尔法庭文件大多是扫描图像(PDF)且没有文本层感到很沮丧。这使得它们无法使用Ctrl+F搜索或进行程序化分析。
我使用Python、Tesseract和OpenSearch构建了一个管道来解决这个问题。
网站:<a href="https://epsteinfilez.com" rel="nofollow">https://epsteinfilez.com</a>
技术栈:
摄取:Python worker使用ocrmypdf(Tesseract)对原始文件执行并行OCR。
搜索:OpenSearch用于索引提取的文本。
前端:Next.js (SSR) 用于UI。
基础设施:自托管Docker swarm。
功能:
在约15,000页中实现亚秒级的全文搜索。
直接在PDF页面上高亮显示搜索词。
深度链接到特定页面/文档。
这是一个透明度工具,而非政治工具。我希望让研究人员和记者能够访问原始的第一手资料。
欢迎提供关于搜索相关性或索引管道的反馈!
1 分•作者: nvader•6 个月前
4 分•作者: ediblepython•6 个月前
1 分•作者: givinguflac•6 个月前
1 分•作者: bane•6 个月前
1 分•作者: yoan9224•6 个月前
我之前每个月花 200 美元在一个收入为 0 的副业项目上做数据分析。然后我花了 2 个小时试图在 GA4 中配置一个简单的漏斗,最终决定自己搭建一个。<p>Prysm 正是我希望存在的东西:<p><pre><code> - 访客位置的实时 3D 地球仪(Three.js + WebGL 着色器)
- 3.8kb 的追踪脚本,而 GA 是 45kb – 原生 JS,零依赖
- 无 Cookie / 指纹识别 – 无需同意横幅
- AI 聊天,用于提问(“为什么流量激增?”)
- 自动时间线:首位客户、收入目标、流量事件
</code></pre>
有趣的部分:
- 将追踪脚本保持在 200 行以内,同时处理 SPA、离线模式、自定义事件
- 使用 GPT-4o-mini 进行简单查询,将成本控制在 9 美元 / 客户 / 月
- 为地球仪构建连接池(最多 5 个并发连接,以避免压垮 Supabase Realtime)<p>技术栈:Next.js, Supabase, Mapbox, OpenAI
定价:9.99–29.99 美元 / 月,面向独立黑客<p>现已开启内测。什么原因会让你最终从你目前的数据分析工具切换过来?
5 分•作者: avipeltz•6 个月前
大家好,我们是 Avi、Kiet 和 Satya。我们正在构建 Superset,一个开源终端,用于并行管理大量编码代理(Claude Code、Codex 等)。
* Superset 可以轻松创建 git 工作树并自动设置您的环境
* 代理和终端标签页与工作树隔离,防止冲突
* 内置钩子 \[0],用于在您的编码代理完成/需要关注时通知您
* 一个差异查看器,用于查看更改并快速创建 PR
我们是三位工程师,曾构建和维护大型代码库,并且一直希望尽可能并行地处理尽可能多的功能。Git 工作树 \[1] 对于此任务来说是一个有用的解决方案,但它们启动和管理起来很麻烦。我们开始构建 Superset,作为一个使用我们发现的并行运行代理的最佳实践的工具。
这是一个演示视频:
[https://www.youtube.com/watch?v=pHJhKFX2S-4](https://www.youtube.com/watch?v=pHJhKFX2S-4)
我们都使用 Superset 来构建 Superset,它使我们的生产力翻了一倍以上(您可以通过自动更新看出来)。我们有很多朋友使用它来代替他们选择的 IDE 或用 Superset 替换他们的终端,并且它似乎很受欢迎,因为他们可以继续使用他们想要的任何 CLI 代理或工具,而 Superset 只是增强了他们现有的工具集。
Superset 主要用 Typescript 编写,基于 Electron、xterm.js 和 node-pty。我们选择 xterm+node-pty 是因为它是在桌面应用程序中运行真实 PTY 的一种经过验证的方法(由 VSCode 和 Hyper 使用),而 Electron 让我们能够快速发布。
接下来,我们正在探索一些功能,例如在云 VM 中运行工作树以释放本地资源、代理之间的上下文共享,以及一个顶级的编排代理,用于同时管理多个工作树或项目。
在构建过程中,我们学到了很多东西:制作一个好的终端比你想象的要复杂,而且终端和 git 的默认设置并非通用(svn 与 git、奇怪的 shell 设置、复杂的多仓库等)。
为自己构建产品会更快,而且非常有趣。目前还处于早期阶段,但我们希望您在所有 CLI 工具和环境中尝试 Superset,我们欢迎您的反馈!:)
\[0] [https://code.claude.com/docs/en/hooks](https://code.claude.com/docs/en/hooks)
\[1] [https://git-scm.com/docs/git-worktree](https://git-scm.com/docs/git-worktree)
27 分•作者: danburzo•6 个月前
8 分•作者: prismatic•6 个月前