最新

“Kryptos”雕塑谜题终极解答以近百万美元售出

1 分•作者: speckx•7 个月前

决策矩阵助力更优工程决策

2 分•作者: bored_hacker•7 个月前

使用 MiniZinc 解决帕特里奇装箱问题

3 分•作者: mzl•7 个月前

人类行为的连贯性不足以成为人工智能的基准。

2 分•作者: AndrewKemendo•7 个月前

迈向每代币毫焦耳级别——Apple Watch 上的 AI

1 分•作者: amund•7 个月前

Show HN: 使用 Docker 和 Llama 3 的离线 RAG 系统（无云 API）

3 分•作者: PhilYeh•7 个月前

我将分享一个我构建的完全离线的 RAG（检索增强生成）堆栈，用于解决工业环境中一个关键问题：数据隐私和重复的 API 费用。我们每天处理敏感的专有数据表和示意图，这使得基于云的 LLM（如 ChatGPT）无法合规。解决方案：一个容器化架构，确保数据永远不会离开本地网络。堆栈： LLM：Llama 3（通过 Ollama）向量数据库：ChromaDB 部署：Docker Compose（一键设置）优势：零 API 费用，无安全风险，本地性能快速。代码和架构在此处提供： <a href="https://github.com/PhilYeh1212/Local-AI-Knowledge-Base-Docker-Llama3" rel="nofollow">https://github.com/PhilYeh1212/Local-AI-Knowledge-Base-Docke...</a> 欢迎提问关于 GPU 直通设置或文档摄入流程的问题。

旅行者1号即将到达距离地球一光日的位置

54 分•作者: ashishgupta2209•7 个月前

人类生命历程中的拓扑转折点

1 分•作者: gmays•7 个月前

平均故障间隔时间

1 分•作者: ColinWright•7 个月前

微软签名透明度：保障软件供应链安全

1 分•作者: speckx•7 个月前

使用 Go 语言创建并托管 Telegram Bot

1 分•作者: ritzaco•7 个月前

大语言模型的预测能力取决于我们问了什么

1 分•作者: paraschopra•7 个月前

Show HN: LLM-models – 一个用于列出各提供商可用 LLM 模型的 CLI 工具

2 分•作者: ljubomir•7 个月前

我构建了一个简单的命令行工具，用于解决我反复遇到的一个问题：在任何给定时间，通过 OpenAI、Anthropic、Google 和 xAI 的 API 实际可用的确切模型名称是什么？ API 本身提供了这些信息，但我厌倦了查阅文档或编写一次性脚本。现在，我只需运行： ```bash $ llm-models -p Anthropic ``` 就可以获得当前列表，并带有易于理解的名称。安装： ```bash macOS: brew tap ljbuturovic/tap && brew install llm-models Linux: pipx install llm-models Windows: pip install llm-models ``` 该工具是在 Claude Code 的帮助下构建的。它直接查询每个提供商的 API，因此您可以获得实时可用性，而不是过时的文档。欢迎提供反馈，并乐于在有兴趣的情况下添加更多提供商！

使用 Claude Code 从零开始构建 64 位操作系统

1 分•作者: todsacerdoti•7 个月前

Show HN: npm 包，用于重新安装项目依赖，并附带恶意软件扫描器 (safe-chain)

1 分•作者: nycalexander•7 个月前

都柏林上空出现的“极光莓”是什么？

1 分•作者: austinallegro•7 个月前

拯救全美的野生火鸡的保护成就

2 分•作者: quapster•7 个月前

Show HN: ChatIndex – AI 智能体无损记忆系统

7 分•作者: LoMoGan•7 个月前

当前的人工智能聊天助手面临一个根本性的挑战：在长时间对话中的上下文管理。虽然目前的 LLM 应用通过使用多个独立的对话来规避上下文限制，但一个真正像人类一样的 AI 助手应该维护一个单一、连贯的对话线程，这使得高效的上下文管理至关重要。尽管现代 LLM 拥有更长的上下文，但它们仍然受到长上下文问题（例如，上下文腐烂问题）的困扰——推理能力随着上下文的增长而下降。基于记忆的系统已经被发明出来以缓解上下文腐烂问题，然而，基于记忆的表征本质上是有损的，并且不可避免地会丢失原始对话中的信息。原则上，没有一种有损表征对所有下游任务都是普遍完美的。这导致了定义一个灵活的上下文管理系统的两个关键要求： 1. 保留原始数据：一个索引系统，可以在必要时检索原始对话。 2. 多分辨率访问：能够按需以不同细节级别检索信息。 ChatIndex 是一个上下文管理系统，它通过基于层次树的索引和基于智能推理的检索，使 LLM 能够高效地导航和利用长对话历史。开源代码库：<a href="https://github.com/VectifyAI/ChatIndex" rel="nofollow">https://github.com/VectifyAI/ChatIndex</a>

我私信了一位韩国总统候选人，结果帮他打造了核心竞选团队

37 分•作者: wjsdj2009•7 个月前

.us 域名回忆

23 分•作者: sabas_ge•7 个月前

上一页 1...3141 3142 3143 3144 3145...5428 下一页