2 分•作者: croes•10 天前
返回首页
最新
1 分•作者: Pistachero•10 天前
1 分•作者: jgilias•10 天前
26 分•作者: computersuck•10 天前
1 分•作者: PankajGhosh•10 天前
1 分•作者: rented_mule•10 天前
1 分•作者: leonidasrup•10 天前
1 分•作者: gmays•10 天前
1 分•作者: gritzko•10 天前
1 分•作者: krmani•10 天前
带单词弹窗定义的中文阅读器
<p><a href="https://apps.apple.com/us/app/hanzi-popup/id6739193193">https://apps.apple.com/us/app/hanzi-popup/id6739193193</a><p>使用 Hanzi Popup 提升您的中文阅读体验。即时理解任何汉字——包含拼音、释义、HSK 等级和 AI 发音——无需离开当前页面。无论您是在备考 HSK、阅读中文新闻,还是初次探索中文,Hanzi Popup 都能让每个单词易于理解。<p>新版应用程序,为中文学习者提供众多功能。<p>- 重新设计的图书馆 — 每项内容均包含主图、标签、分类、阅读进度和详细概览。
- 离线阅读 — 保存任何网页书签,无需网络即可阅读。
- 新格式 — 现在支持 EPub、Word、PowerPoint 和 Markdown。
- 音频/视频格式 - 支持带字幕选择的音频和视频。
- YouTube 和 Bilibili - 为 YouTube 和 Bilibili 视频字幕提供弹窗单词定义。
- PDF 阅读器 — 支持 OCR,可点击查找和 TTS 单词高亮。
- 相机 OCR — 指向印刷文本,点击任意单词即可查找。
- TTS 单词高亮 — EPUB、PDF 和网页文章中当前朗读的单词高亮显示。
- 阅读模式 — 通过 Defuddle 或 Readability 清理网页,仅保留纯文本。
1 分•作者: pullshark91•10 天前
1 分•作者: gmays•10 天前
1 分•作者: birdculture•10 天前
1 分•作者: doener•10 天前
5 分•作者: giuliomagnifico•10 天前
10 分•作者: naturalmovement•10 天前
4 分•作者: yolo-auto•10 天前
这是一个关于我如何启动一个面向约 60 名在等候名单上的热门用户的无限 LLM 提供商的故事,然后立即向他们提供了一个完全失灵的死循环模型,以及为什么大多数人非常合理地离开了,但由于一些非常友善的人仍然坚持下来,我们让项目得以继续,尽管仍然很混乱,但正在获得关注。
稍微回顾一下——我相信 AI 代理的全部意义在于它们应该持续工作。它们应该读取文件、重试、搜索、编码、总结、运行工具并循环直到任务完成。当你的雇主为你付费时,谁会在乎成本,但当涉及到我的个人金钱/爱好时,如果每一次循环都感觉像是一笔小小的财务支出,你就会开始像看管代理一样盯着它,而不是使用它,这并不好玩。
另一方面,按量计费让我担心使用过多。订阅式计费让我觉得我需要用尽每一分钱,否则我就是在“浪费它”。如果有一个无限提供商就好了……
然后我加入了 AMD 开发者计划——我获得了一些积分,可以启动我自己的 MI300x,并开始在 AMD 上进行 vllm/sglang 推理服务的试验。
在了解了 AMD MI300x 之后,我做了一些草率的计算:
每小时租用 MI300x 2.00 美元 = 每月约 1500 美元。它大概可以支持约 150 名用户使用小型 MOE 模型,如 qwen-35b-3a,也许更多。
1500 美元 / 150 名用户 = 每月 10.00 美元,我们都可以以很小的价格玩代理。
你可以稍微超额订阅,所以我最终确定为每位用户每月 6 美元,提供 2 个生成槽位,128k 上下文,无 token 限制,无速率限制。
我构建了网站、路由器,创建了等候名单,然后将 MI300x 过度优化,以至于 vllm bench 的输出速度达到了 3k+,吞吐量达到了 40k+……但我没有测试最终的配置/服务命令……这就是我灾难性启动的地方。你无法提示它,否则它就会陷入循环或出现 bug,它被诅咒了。这就是我们失去许多人的地方。
幸运的是,我的朋友有几块 3090,所以他向我伸出了援手,开始为我们托管 qwen,使用 2 块 3090,我们终于有了一个可用的模型,而不会让我们可怜的 3 名用户每小时花费 2.00 美元。
我们开始吸引更多用户,所以我们升级到了 4 块 3090。我们还有很多空间容纳更多用户,但即便如此,从那时起:
我们配置 vllm 错误了大约 15 次
一块 GPU 坏了
我们停电了
我为 openclaw、hermes、pi-mono 制作了一堆一键启动,但它们都没有真正正常工作,这可能吓跑了人们。这些仍然在我们的网站上。
……但那些懂行的人似乎非常喜欢这个价格点。总的来说,我们有大约 98% 的正常运行时间。已经过去一个月了。我们都学到了很多,即使我们已经有 SWE/SE/AI 的背景,但要对几个付费用户负责,迫使我们真正专注于为他们提供一个好产品。现在我认为我们可能快要能支付电费/托管费了,这样我们就不会亏本运营了(如果算上 3090 的资本支出,我们仍然亏本)。
我们的盈亏平衡点是迁移到云端以最大化利用 MI300x,它现在已经调优完毕,一旦我们获得用户就可以投入使用。
我发现,在某些领域,订阅我们的服务比运行模型更便宜(但作为一个热爱本地模型的人,我完全理解)。
从那时起,我一直在开发一个桌面代理,它实际上可以与 qwen 等小型模型一起工作——这将取代那些损坏的一键启动。它很基础,但它是开箱即用的东西。我将其开源了,你可以在这里看到我所说的:https://github.com/yolo-auto-org/yolo-auto-desktop,我们的网站是 yolo-auto.com,我们有一个糟糕的免费套餐来证明它有效!
总之,希望你从中获得了一些乐趣或觉得有趣!如果你有任何问题,请随时提出。
1 分•作者: slater•10 天前
2 分•作者: csbartus•10 天前
1 分•作者: ksec•10 天前