HackerNews中文版

带单词弹窗定义的中文阅读器 <p><a href="https://apps.apple.com/us/app/hanzi-popup/id6739193193">https://apps.apple.com/us/app/hanzi-popup/id6739193193</a><p>使用 Hanzi Popup 提升您的中文阅读体验。即时理解任何汉字——包含拼音、释义、HSK 等级和 AI 发音——无需离开当前页面。无论您是在备考 HSK、阅读中文新闻，还是初次探索中文，Hanzi Popup 都能让每个单词易于理解。<p>新版应用程序，为中文学习者提供众多功能。<p>- 重新设计的图书馆 — 每项内容均包含主图、标签、分类、阅读进度和详细概览。 - 离线阅读 — 保存任何网页书签，无需网络即可阅读。 - 新格式 — 现在支持 EPub、Word、PowerPoint 和 Markdown。 - 音频/视频格式 - 支持带字幕选择的音频和视频。 - YouTube 和 Bilibili - 为 YouTube 和 Bilibili 视频字幕提供弹窗单词定义。 - PDF 阅读器 — 支持 OCR，可点击查找和 TTS 单词高亮。 - 相机 OCR — 指向印刷文本，点击任意单词即可查找。 - TTS 单词高亮 — EPUB、PDF 和网页文章中当前朗读的单词高亮显示。 - 阅读模式 — 通过 Defuddle 或 Readability 清理网页，仅保留纯文本。

有效的笔记记录

1 分•作者: pullshark91•10 天前

SchemaFlow：代理式数据库变更影响分析、SQL 生成与评估护栏

1 分•作者: gmays•10 天前

让 FlashAttention-4 在推理时更快

1 分•作者: birdculture•10 天前

一名德国失踪女子出现在爱泼斯坦档案中

1 分•作者: doener•10 天前

意识可能并非地球生命独有，论文指出

5 分•作者: giuliomagnifico•10 天前

Tribblix：复古的 illumos 发行版

10 分•作者: naturalmovement•10 天前

我如何用四块 RTX 3090 显卡运行一个每月 6 美元的无限 AI 服务

4 分•作者: yolo-auto•10 天前

这是一个关于我如何启动一个面向约 60 名在等候名单上的热门用户的无限 LLM 提供商的故事，然后立即向他们提供了一个完全失灵的死循环模型，以及为什么大多数人非常合理地离开了，但由于一些非常友善的人仍然坚持下来，我们让项目得以继续，尽管仍然很混乱，但正在获得关注。稍微回顾一下——我相信 AI 代理的全部意义在于它们应该持续工作。它们应该读取文件、重试、搜索、编码、总结、运行工具并循环直到任务完成。当你的雇主为你付费时，谁会在乎成本，但当涉及到我的个人金钱/爱好时，如果每一次循环都感觉像是一笔小小的财务支出，你就会开始像看管代理一样盯着它，而不是使用它，这并不好玩。另一方面，按量计费让我担心使用过多。订阅式计费让我觉得我需要用尽每一分钱，否则我就是在“浪费它”。如果有一个无限提供商就好了…… 然后我加入了 AMD 开发者计划——我获得了一些积分，可以启动我自己的 MI300x，并开始在 AMD 上进行 vllm/sglang 推理服务的试验。在了解了 AMD MI300x 之后，我做了一些草率的计算：每小时租用 MI300x 2.00 美元 = 每月约 1500 美元。它大概可以支持约 150 名用户使用小型 MOE 模型，如 qwen-35b-3a，也许更多。 1500 美元 / 150 名用户 = 每月 10.00 美元，我们都可以以很小的价格玩代理。你可以稍微超额订阅，所以我最终确定为每位用户每月 6 美元，提供 2 个生成槽位，128k 上下文，无 token 限制，无速率限制。我构建了网站、路由器，创建了等候名单，然后将 MI300x 过度优化，以至于 vllm bench 的输出速度达到了 3k+，吞吐量达到了 40k+……但我没有测试最终的配置/服务命令……这就是我灾难性启动的地方。你无法提示它，否则它就会陷入循环或出现 bug，它被诅咒了。这就是我们失去许多人的地方。幸运的是，我的朋友有几块 3090，所以他向我伸出了援手，开始为我们托管 qwen，使用 2 块 3090，我们终于有了一个可用的模型，而不会让我们可怜的 3 名用户每小时花费 2.00 美元。我们开始吸引更多用户，所以我们升级到了 4 块 3090。我们还有很多空间容纳更多用户，但即便如此，从那时起：我们配置 vllm 错误了大约 15 次一块 GPU 坏了我们停电了我为 openclaw、hermes、pi-mono 制作了一堆一键启动，但它们都没有真正正常工作，这可能吓跑了人们。这些仍然在我们的网站上。 ……但那些懂行的人似乎非常喜欢这个价格点。总的来说，我们有大约 98% 的正常运行时间。已经过去一个月了。我们都学到了很多，即使我们已经有 SWE/SE/AI 的背景，但要对几个付费用户负责，迫使我们真正专注于为他们提供一个好产品。现在我认为我们可能快要能支付电费/托管费了，这样我们就不会亏本运营了（如果算上 3090 的资本支出，我们仍然亏本）。我们的盈亏平衡点是迁移到云端以最大化利用 MI300x，它现在已经调优完毕，一旦我们获得用户就可以投入使用。我发现，在某些领域，订阅我们的服务比运行模型更便宜（但作为一个热爱本地模型的人，我完全理解）。从那时起，我一直在开发一个桌面代理，它实际上可以与 qwen 等小型模型一起工作——这将取代那些损坏的一键启动。它很基础，但它是开箱即用的东西。我将其开源了，你可以在这里看到我所说的：https://github.com/yolo-auto-org/yolo-auto-desktop，我们的网站是 yolo-auto.com，我们有一个糟糕的免费套餐来证明它有效！总之，希望你从中获得了一些乐趣或觉得有趣！如果你有任何问题，请随时提出。

新文件揭露九位数、硅谷资助的“富足运动”

1 分•作者: slater•10 天前

灭绝级资本主义

2 分•作者: csbartus•10 天前

Phoenix LiveView 1.2 发布

1 分•作者: ksec•10 天前

最新