1作者: jerryliu128 个月前
大家好!我一直在开发 Dayflow,这是一款 macOS 应用,可以自动追踪你实际在做什么(不仅仅是哪些应用是打开的)。 它的功能如下: - 创建你一天的语义时间线; - 通过理解你屏幕上的内容来实现(使用本地或云端视觉语言模型); - 让你无需手动记录就能确切地看到你的时间都花在了哪里。 传统的计时器会告诉你“在 Chrome 上花了 3 小时”,这并没有什么帮助。Dayflow 实际上可以理解你是在阅读文档、调试代码,还是在浏览 HN。例如,你得到的结果不是“Chrome:3 小时”,而是“审查 PR 评论:45 分钟”、“阅读关于 Rust 的 HN 帖子:20 分钟”、“调试身份验证流程:1.5 小时”。 我曾是 Rewind 的早期用户,但很少使用它的检索功能。我开发 Dayflow 是因为我看到了屏幕数据的其他有趣用途。我发现它能帮助我保持工作状态——我每隔几个小时就会查看一下,确保我把时间花在了我希望的方式上——如果不是,我会尝试纠正。 关于隐私,你需要了解以下几点: - 100% 在本地运行,使用 qwen2.5-vl-3b (~4GB 模型) - 不上传到云端,无需账户 - 完整的源代码可在 MIT 许可证下获取 (<https://github.com/JerryZLiu/Dayflow>) - 可选:自带 Gemini API 密钥以获得更好的质量(存储在钥匙串中,并提供免费层绕过方案以防止对你的数据进行训练) 技术栈非常简单,使用 SwiftUI 和本地 sqlite 数据库。使用原生 macOS API 进行高效的屏幕截图。由于大多数在本地运行 LLM 的人已经有了他们自己的选择工具(Ollama、LLMStudio 等),我决定不在 Dayflow 中嵌入 LLM。 到目前为止,最大的挑战是从 Gemini 2.5 Pro 等 SOTA 视觉模型适应到小型本地模型。我的限制是它必须占用 &lt;4GB 的内存并具有视觉能力。我不得不做大量的评估,才发现 Qwen2.5VL-3B 是大小和质量的最佳平衡,但仍然需要接受相当大的质量折衷。我还创造性地使用了采样率和提示分块来处理 100 倍小的上下文窗口。处理一个 15 分钟的片段需要大约 32 次本地 LLM 调用,而 Gemini 只需要 2 次调用! 我接下来要做的事情: 蒸馏:使用 Gemini 的高质量输出来作为训练数据,以教导本地模型它需要的模式,希望能缩小质量差距。 自定义仪表板,你可以在其中跟踪任何问题的答案,例如“我在 HN 上花了多长时间?”或“距离我今天第一次深度工作还有几个小时” 我很乐意听取你的想法,特别是如果你在生产力追踪方面遇到过困难,或者对这类工具的功能有什么想法。
2作者: rlucato8 个月前
我开发了 Artifex,这是一个 Python 库,用于创建针对 NLP 和文本分类的特定任务的 LLM,无需训练数据。目前,仅支持意图分类和安全防护模型,但我将根据用户的反馈很快添加更多模型。 我创建它的原因是,通用 LLM 对于简单的文本分类任务来说是过度设计的,而且 LLM API 的费用可能很快就会变得昂贵。另一方面,为特定任务微调 LLM 需要标注数据,但并非所有人都有这些数据。 这就是我创建这个库的原因,它可以在没有训练数据的情况下训练小型、特定任务的 LLM。您只需描述模型应该如何运行,它就会在为此目的生成的合成数据上进行训练。 这些模型可以在本地(无需 GPU)或小型服务器上运行,从而分担简单任务的负载,并减少对第三方 LLM API 的依赖。 我正在寻求任何关于新模型/任务的反馈或建议。这是 GitHub 仓库:<a href="https://github.com/tanaos/artifex" rel="nofollow">https://github.com/tanaos/artifex</a>
2作者: Nick-Abbott8 个月前
后端 API 常常会演变成庞大的编排类,充斥着重复的调用和手动并发。 我一直在开发 Mosaic,这是一个用 Kotlin 编写的框架,它将响应组合成小的、请求范围内的“瓦片”。每个瓦片在每个请求中运行一次,依赖关系自动解析,并且独立的瓦片并行执行,无需任何样板代码。 目前还处于早期阶段(v0.2.0),但现在已经可以用于缓存、并发和可测试性。 欢迎大家对这种方法提出反馈意见。 GitHub: <a href="https:&#x2F;&#x2F;github.com&#x2F;Nick-Abbott&#x2F;Mosaic" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;Nick-Abbott&#x2F;Mosaic</a> Maven Central: org.buildmosaic:mosaic-core:0.2.0
2作者: garbinhuang8 个月前
Hi HN, 我是 epress 的创建者。经过大量的工作,我非常兴奋(也有些紧张)地终于向大家分享它。 多年来,我一直觉得自己是每天使用的平台上的一个数字租户。我的内容、我的社交关系图谱、我的在线身份——它们都存储在别人的服务器上,受制于他们的规则、算法和商业模式。我可能会被封号,我的数据可能会被出售,或者我依赖的 API 可能会突然被设为付费墙。 我研究了现有的去中心化替代方案。虽然很多都是很棒的项目,但我发现它们通常将信任从一家大公司转移到服务器管理员(在联邦模型中),或者依赖于一个可能不可靠或最终会收取费用的自愿中继网络。对第三方基础设施的根本依赖依然存在。 epress 是我尝试的解决方案,它基于一个简单、近乎怀旧的原则:<i>真正的所有权需要自托管。</i> 它是一个去中心化的社交网络,其中: * 你运行自己的节点:你的节点是你的主权领地。你的所有数据都由你掌控。 * 你的以太坊地址就是你的身份:我们使用 EIP-4361(使用以太坊登录)进行身份验证。不再需要用户名/密码的繁琐操作。 * 没有第三方依赖:没有中继、没有中心节点、没有联邦服务器。内容通过节点之间轻量级的“通知-拉取”协议进行点对点分发。 * 所有内容都可验证:每条公开内容都经过签名,并附带一个“来源证明”,这是一个加密收据,证明了谁发布了什么内容,以及何时发布。 这个项目深受早期互联网精神的启发,但它使用现代技术构建,旨在使自托管再次可行和易于访问。 现在还处于早期阶段,未来还有很长的路要走。为了向大家展示这不仅仅是一个演示,代码现在已经开源,我们已经有实时节点等待你关注。官方项目博客位于 <a href="https://epress.blog" rel="nofollow">https://epress.blog</a>,它是一个 epress 节点,你也可以访问我的个人节点 <a href="https://garbin.blog" rel="nofollow">https://garbin.blog</a>。 我今天一整天都会在这里回答任何问题,更重要的是,倾听你的反馈和批评。如果在设置过程中需要实时支持或更直接的反馈,请随时加入我们的 Telegram 群组:<a href="https://t.me/+mZMgNSIVy1MwMmVl" rel="nofollow">https://t.me/+mZMgNSIVy1MwMmVl</a> 白皮书(深入了解):<a href="https://github.com/epressworld/epress/blob/main/docs/en/WHITEPAPER.md" rel="nofollow">https://github.com/epressworld/epress/blob/main/docs/en/WHIT...</a> 视频演示:<a href="https://youtu.be/BB1Zn3oFDVc" rel="nofollow">https://youtu.be/BB1Zn3oFDVc</a> 感谢你抽出时间来查看。
4作者: mehdig108 个月前
嘿, 我们在Kibana/Prometheus中积累了大量的日志/指标数据,因此,每当客户端数据馈送或其他方面出现问题时,支持团队都会要求我们检查发生了什么。 由于问题可能并非出在我们这边,开发人员开始向非技术团队开放这些工具的访问权限。让非技术人员构建Grafana仪表盘并进行某种调试,感觉有点奇怪,但即使他们操作起来有些笨拙,似乎也很享受对系统的可见性,而且开发人员也不再需要负责调试每一个小问题了。 这种情况是只在我们公司出现吗?或者你们也遇到过类似的情况?如果是的话,你们是如何向非技术人员展示这些数据的呢?