2作者: giulioco9 个月前
我构建了一个社交聆听助手(是的,就像所有人一样)。但在这个过程中,我意识到最有用的部分之一就是找到合适的社区。所以我开始保存它们,现在我大约有 7 万个社区。<p>然后我添加了语义搜索,这样你就可以通过含义来查找社区。数据集会随着人们使用平台而增长。<p>工作原理<p>- 免费账户:对已保存的 7 万个社区进行语义搜索 - 付费账户:首先进行实时搜索(来自来源的关键词搜索),然后在更新的社区数据集上运行语义搜索<p>我还构建了一个助手,给定一个网站,它可以找到相关的社区。例如:<a href="https:&#x2F;&#x2F;www.pluggo.ai&#x2F;sites&#x2F;bloodtrack_au" rel="nofollow">https:&#x2F;&#x2F;www.pluggo.ai&#x2F;sites&#x2F;bloodtrack_au</a><p>目前它涵盖:<p>- Reddit 社区 - X 社区 - LinkedIn 群组 - Facebook 群组 - Discord 服务器 - Mastodon 服务器<p>接下来,我很想找到一种方法来添加 Slack 工作区,但我还没有找到一个好方法,除了一个可以四处寻找 Slack 邀请链接的爬虫?如果你知道一个可靠的来源,我很乐意倾听。<p>对于我应该添加的其他来源,有什么建议吗?
5作者: Fabeltjeskrant9 个月前
如果我们希望摆脱大型科技公司的控制,并希望信息/讨论能够被广泛传播和复制,为什么我们又要重新使用 Usenet 呢?
2作者: sreenathmenon9 个月前
我构建了 llmswap 来解决我在黑客马拉松中反复遇到的一个问题——在开发过程中反复测试相同的提示词时,API 积分被迅速耗尽。<p>它是一个简单的 Python 包,为 OpenAI、Anthropic、Google Gemini 和本地模型(Ollama)提供了一个统一的接口,并内置了响应缓存功能,可以将 API 成本降低 50-90%。<p>主要功能: - 智能缓存,具有 TTL 和内存限制 - 针对多用户应用程序的上下文感知缓存 - 当一个提供商失败时,自动在不同提供商之间回退 - 零配置 - 通过环境变量工作<p><pre><code> from llmswap import LLMClient client = LLMClient(cache_enabled=True) response = client.query(&quot;Explain quantum computing&quot;) # 第二个相同的查询会立即从缓存中返回(免费) </code></pre> 出于安全考虑,缓存功能默认是禁用的。启用后,它是线程安全的,并包括针对多用户应用程序的上下文隔离。<p>这个项目是从一个黑客马拉松项目的组件构建的。已经在 PyPI 上获得了 2.2k 的下载量。希望它能帮助其他人节省开发过程中的 API 成本。<p>GitHub:<a href="https:&#x2F;&#x2F;github.com&#x2F;sreenathmmenon&#x2F;llmswap" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;sreenathmmenon&#x2F;llmswap</a> PyPI:<a href="https:&#x2F;&#x2F;pypi.org&#x2F;project&#x2F;llmswap&#x2F;" rel="nofollow">https:&#x2F;&#x2F;pypi.org&#x2F;project&#x2F;llmswap&#x2F;</a>