1 分•作者: roschdal•5 天前
返回首页
一周热榜
1 分•作者: waihtis•5 天前
1 分•作者: julienreszka•5 天前
1 分•作者: ersinesen•5 天前
构成音乐基础的音符、音阶、和声,看似是基本元素,实则不然。<p>它们是涌现结构。<p>音高只是加速的节奏。<p>由 NoteookLM 生成的播客:<a href="https://www.youtube.com/watch?v=q9bFUocrm70" rel="nofollow">https://www.youtube.com/watch?v=q9bFUocrm70</a>
1 分•作者: zeristor•5 天前
1 分•作者: nip•5 天前
嗨,HN!
我开发了 SimplePDF Copilot:一个可以与 PDF 编辑器交互的 AI 助手。它可以填写字段、回答问题、专注于特定字段、添加字段、删除页面等等。
它基于我 7 年前开始的 SimplePDF 构建,SimplePDF 率先实现了注重隐私的客户端 PDF 编辑,现在每月有超过 20 万人使用。
关于隐私模型:PDF 本身永远不会离开浏览器。解析、渲染和字段检测都在客户端运行。
模型需要处理的文本(以及您的消息)会发送到您指定的 LLM。默认情况下,这是我们的演示代理(DeepSeek V4 Flash,速率限制),但您可以使用 BYOK(自带密钥)并将其指向任何云提供商,或者完全本地化(我一直在使用 LM Studio 进行测试)。
与现有的“与 PDF 聊天”工具只检索文本/OCR 层不同,Copilot 可以对 PDF 进行操作:填写字段、添加字段(使用 Joe Barrow 的 CommonForms [1],HN 上的 jbarrow,并在其基础上添加了一些后处理启发式方法进行客户端检测)、专注于字段、删除页面等等。
我开发这个是因为 SimplePDF 主要被医疗保健客户使用,他们非常重视文档隐私,我希望有一个 AI 体验,不需要将 PII(个人身份信息)发送给第三方。
技术栈相当标准:
* Tanstack Start
* 来自 Vercel 的 AI SDK
* Tailwind(我个人更喜欢 CSS 模块,我比较老派,但自从我开源以来,我认为 Tailwind 会更合适)
更有趣的部分是客户端工具调用:事件通过 iframe postMessage 来回传递。
如果您不熟悉“工具调用”和“客户端工具调用”,这里有一个简要介绍:
工具调用是 LLM 用于执行操作的方式。当 Claude 运行 grep 或 ls,或者访问 MCP 服务器时,这些都是工具调用。
客户端工具调用意味着调用工具的意图来自 LLM,但执行发生在浏览器中。
这很重要,因为它:速度快,您无法比客户端到客户端的操作更快,并且还可以让您限制向 LLM 暴露的数据。对于演示,我确实将文档内容提供给 LLM,但这种连接可以简单地通过删除暴露内容数据的工具来切断。
演示是完全开源的,可在 Github [2] 上找到,演示与此帖子的链接相同 [3]
SimplePDF 本身(作为 iframe 加载)不是开源的。
我可以继续谈论这个,如果您有任何问题,请告诉我,什么都可以问!
[1] <a href="https://github.com/jbarrow/commonforms" rel="nofollow">https://github.com/jbarrow/commonforms</a>
[2] <a href="https://github.com/SimplePDF/simplepdf-embed/tree/main/copilot" rel="nofollow">https://github.com/SimplePDF/simplepdf-embed/tree/main/copilot...</a>
[3] <a href="https://copilot.simplepdf.com/?share=a7d00ad073c75a75d493228e6ff7b11eb3f2d945b6175913e87898ec96ca8076&form=w9&lang=en" rel="nofollow">https://copilot.simplepdf.com/?share=a7d00ad073c75a75d493228...</a>
1 分•作者: 01-_-•5 天前
1 分•作者: gjvc•5 天前
1 分•作者: usmansidd•5 天前
1 分•作者: jjgreen•5 天前
1 分•作者: doener•5 天前
1 分•作者: Tomte•5 天前
1 分•作者: Jean-Philipe•4 天前
你好,*,
我的女儿 14 岁,想开始开发游戏。你有什么推荐的框架/引擎吗?我觉得她已经足够大了,可以从一些“真正”的东西开始,而不是专门针对儿童的游戏引擎。不过,它应该有趣且易于上手。我考虑过 gbstudio、Godot,甚至是基于 JavaScript/HTML 的引擎。
她喜欢《星露谷物语》和《我的世界》,所以我想我们会选择像素艺术风格的。我可以提供支持,但我不希望她因为等我解决问题而受阻。
1 分•作者: ned1010•4 天前
1 分•作者: YassineChahdi•4 天前
1 分•作者: microsoftedging•4 天前
1 分•作者: tosh•4 天前
1 分•作者: tosh•4 天前
1 分•作者: schmorptron•4 天前
1 分•作者: voisin•4 天前