返回首页

一周热榜

1作者: yousef_g6 天前
Hi HN,我构建这个项目是因为我想看看,我是否能在独立研究人员可用的硬件上预训练大词汇量LLM(比如拥有26.2万个token的Gemma)。 标准的精确交叉熵在16GB GPU上,遇到这种规模时会立刻耗尽内存(OOM)。 为了绕过这个问题,我实现了MAXIS损失函数。它使用“幽灵Logit”来数学模拟未采样token的缺失概率质量,而不是实例化完整的26.2万宽的矩阵。 在16GB VRAM显卡(T4)上的基准测试结果: * 与Triton优化的Liger Kernel相比,损失层速度快17.5倍。 * 目标计算中VRAM减少约39%。 包含RandNLA注意力机制,该机制使用因果克罗内克素描来保持内存随着序列长度的增长而平稳。 我在代码库中包含了带有正式数学公式的技术报告。我非常欢迎大家对分区函数模拟或素描方法的任何技术反馈。
1作者: t_peersky6 天前
大多数 AI 代理框架提供自动化功能,但没有一个能让你掌控全局。 NSED v0.5.1 版本发布了我们一直在构建的“人机协同控制平面”:操作员可以在代理进行决策时暂停它们,在下游提交之前审查和编辑缓冲的响应,无需重启即可修补实时配置,并通过评分差异自动标记表现不佳的代理。 操作员 UI 以零依赖的纯 JavaScript 形式发布——没有 npm 图,任何受损的软件包注册表都无法注入到控制平面中,而控制平面对实时代理响应拥有控制权。 对于受监管的部署:欧盟人工智能法案第 14 条、新加坡金融管理局人工智能风险管理指南(MAS AIRM)和美国金融业监管局(FINRA)2026 年的要求都要求进行可证明的人工监督。这就是满足这些要求的架构——你可以直接从源代码库中审计实现。
1作者: kzisme6 天前
我在丹佛住了几年,简单的机场接送价格真是离谱。<p>为了建立/扩大社区,我创建了 Airport Swap。这是一个免费交换机场接送服务的平台。提供接送服务即可获得接送服务!<p>Airport Swap 的创建初衷是建立(或找到)社区,或者依靠信任圈来选择司机/乘客(基本上是朋友的朋友)。我们的目标是连接住在同一条街、同一栋楼,或者曾经参加过同一个桌游小组的人们。<p>欢迎提供任何反馈 :)<p>谢谢!