47 分•作者: cdrnsf•12 天前
返回首页
最新
23 分•作者: rbanffy•12 天前
1 分•作者: l2dy•12 天前
1 分•作者: totaldude87•12 天前
1 分•作者: samixg•12 天前
1 分•作者: pretext•12 天前
1 分•作者: timpera•12 天前
1 分•作者: evolve2k•12 天前
1 分•作者: bryonyoni•12 天前
1 分•作者: luskira•12 天前
1 分•作者: nemath•12 天前
2 分•作者: MohskiBroskiAI•12 天前
LLM 的问题不在于智能,而在于失忆和不诚实。 大家好,我花了几个月的时间构建了 Remember-Me,这是一个开源的“主权大脑”堆栈,旨在完全离线地在消费级硬件上运行。
核心论点很简单:不要租用你的认知。
大多数 RAG(检索增强生成)实现只是“grep for embeddings”。它们很混乱、不精确,并且容易产生幻觉。我想在架构层解决“上下文完整性”问题。
技术堆栈(工作原理):
QDMA(量子梦境记忆架构):它使用分层投影引擎,而不是扁平的向量数据库。它将“热” (Recall) 内存与“冷” (Storage) 内存分开,通过压缩实现有效的无限上下文窗口管理。
CSNP(上下文切换神经协议)- 幻觉终结者:这是最重要的部分。每个记忆片段都被哈希成一个默克尔链。当 LLM 检索上下文时,系统会根据不可变的账本以密码学方式验证检索。
如果哈希值与链不匹配:检索将被拒绝。
结果:AI 在视觉上无法“编造”关于你过去的事情,因为它在数学上受到账本的约束。本地推理:基于 llama.cpp 服务器构建。它在本地运行 Llama-3(或任何 GGUF)。无需 API 密钥。没有数据离开你的机器。
功能:
零依赖:只需 Python 和 GPU(或 CPU)即可在 Windows/Linux 上运行。
可视化界面:包括一个基于 Streamlit 的“认知界面”来可视化记忆状态。
开源:MIT 许可证。 这试图将“自主权”归还给用户。 我认为,如果我们想要 AGI,它需要由我们拥有,而不是通过 API 租用。
存储库:[https://github.com/merchantmoh-debug/Remember-Me-AI](https://github.com/merchantmoh-debug/Remember-Me-AI)
我很乐意听取您对默克尔验证方法的反馈。 限制上下文窗口是否有效地解决了您的“信任”问题?
它完全有效 - 经过全面测试。 如果您之前尝试过 Git Clone 但没有成功 - 因为这并不是我第一次在 Show HN 上展示 - 请随时再试一次。
致所有讨厌 AI 垃圾的人; 贪婪的公司和他们的私人数据被困在云服务器上。
不客气。
干杯,Mohamad
作者注:已成功更新。
框架 50 已激活。
对于任何路过的人来说 - 是的,这是一件大事。 消除 AI 幻觉是一个价值 600 亿美元的市场问题,我正在免费提供这个 + 对您数据的自主控制,以及通过框架 50 进行高端研究(包括高级科学研究)的能力 - 根据 MIT 许可证。 如果您不利用这一点 - 您就是一个白痴。
如果您这样做了 - 欢迎来到未来。
附言:撒谎我能得到什么? 我在存储库上获得了 41 颗星 - 许多来自财富 500 强公司的高级工程师。 如果你太蠢了,分不清真假,那就继续前进吧,伙计。
2 分•作者: justincxa•12 天前
通过 AI 人格和模拟社区,构建了一种验证想法的方法。只需输入一个细分市场和种子提示,你就可以测试想法,并让社区像真实情况一样做出回应——现在可以免费试用 Beta 版!
2 分•作者: kldx•12 天前
在应用内发送消息会被计为活跃行为。如果你加入的桥接群组仅用于接收公告,Beeper 将在未通知你的情况下删除你的桥接账户。
客服并未确认使用第三方 Matrix 客户端是否会被计为应用活跃行为。
很遗憾他们没有提前告知。这项限制在 Pro 付费套餐中也未明确标示。
30 分•作者: PaulHoule•12 天前
17 分•作者: jedixit•12 天前
56 分•作者: meetpateltech•12 天前
4 分•作者: tsvoboda•12 天前
大家好,我们是 TensorPool。我们帮助企业获取和优化大规模计算资源,用于训练基础模型。
**问题**
自从我们完成 YC 项目至今已近一年,我们的平台已经运行了超过 10 万个多节点训练 GPU 小时。
在这些训练运行中,我们见证了无数次凌晨 3 点的作业崩溃,原因包括来自不稳定 GPU 的 Xid 错误,或导致检查点保存损坏的 S3 超时。等你醒来注意到时,你已经损失了 8 个小时以上的计算时间。你赶紧诊断问题,手动从最后一个检查点重新启动,并希望它不会再次发生。周而复始。
对于需要数天甚至数周的训练运行来说,这种持续的看护既令人疲惫又昂贵。失去的研发迭代周期也可能决定一个模型的发布成败(尤其是在短时间预留的情况下)。
**我们构建了什么**
这个代理程序会监控你的训练作业,并在出现问题时自动恢复它们。它与 Kubernetes、Slurm 和 TensorPool 作业兼容。
我们最初构建 TensorPool Agent 是一个内部工具,用于帮助我们调试客户遇到的故障。随着时间的推移,我们意识到它的性能非常好,可以自动化整个故障诊断过程。我们现在正在发布一个公开测试版供大家使用。
最佳情况:TensorPool Agent 检测到故障,诊断根本原因,修复它,并从最后一个检查点重新启动你的作业——所有这些都在你睡觉的时候完成 ;)<p>最坏情况:如果 TensorPool Agent 无法自动修复问题,它会提供初步的根本原因分析(RCA)以及它尝试过的操作列表,让你在调试时抢占先机。
**工作原理**
1) 注册 – 你通过我们的仪表板提供作业调度程序的凭据。权限基于白名单授予;你明确控制代理可以执行的操作。
2) 监控 – 代理持续监控你的作业,以查找故障情况。
3) 恢复 – 发生故障时,代理会分析日志并尝试诊断问题。如果成功,它会从最后一个检查点重新启动作业并恢复监控。如果失败,你将收到带有完整上下文的警报。
**目标故障模式**
该代理程序专为训练深入进行时发生的运行时错误而设计,例如:
- CUDA OOM:内存泄漏、梯度爆炸
- Xid 错误:GPU 硬件故障(Xid 79、63、48 等)
- 分布式通信故障:NCCL 超时、秩失败
- 存储 I/O 错误:检查点损坏
- 网络问题:挂载对象存储上的 S3 请求超时
1 分•作者: apetuskey•12 天前
1 分•作者: bovermyer•12 天前