2作者: 2dogsanerd4 天前
过去几个月,我一直在为受监管环境设计一个 RAG 系统。我不是专业开发人员,但我以严格的“系统工程”和审计思维来构建它。 虽然大多数教程止步于“LangChain + VectorDB”,但我发现,要使其在法律上站得住脚并在运营上保持稳定,需要大约 40 多个额外的组件。 我们从一个简单的摄取脚本转移到“多车道共识引擎”(灵感来自六西格玛),因为标准的 OCR/提取对于我们的用例来说,太容易产生幻觉了。 我们不得不构建广泛的审计、细化到文档级别的 RBAC,以及混合图数据库+向量检索,以获得可接受的准确性。 目前的架构包括: 摄取:4 个并行提取车道(视觉、布局、文本、法律),带有一个共识引擎(“Solomon”),该引擎仅索引由多个来源确认的数据 检索:混合 Neo4j(图数据库)+ ChromaDB(向量数据库),采用互易秩融合 性能:语义缓存(Redis),专门用于含义相似的查询(加速 40 倍) 安全性:完整的 RBAC、对每个提示/检索的审计日志记录以及 PII 屏蔽。 我记录了完整的功能列表和差距分析 [https://gist.github.com/2dogsandanerd/2a3d54085b2daaccbb1125601945ceeb](https://gist.github.com/2dogsandanerd/2a3d54085b2daaccbb1125601945ceeb) 我向社区提出的问题是: 看看这个列表——“稳健的生产工程”和“过度工程”之间的界限在哪里? 对于那些从事金融科技/医疗科技 RAG 的人来说:我还在这个列表中遗漏了哪些关键的失效模式?
2作者: BleedingXiko4 天前
Hi HN, 我在开发自托管媒体服务器时,希望找到一种简单的方法,将视频转码任务分流到网络上可用的硬件,于是构建了 GhostStream。 GhostStream 是一个开源视频转码服务器,具有以下特点: * 零配置启动 * 自动 GPU / 编码器检测(NVENC, QuickSync, AMF, VideoToolbox) * 实时 HLS 流媒体、ABR 和批量模式 * 如果硬件编码失败,自动回退到 CPU * 一个用于进度更新的小型 HTTP + WebSocket API 它设计为在本地运行(无云依赖),并且非常适合作为轻量级媒体服务器的伴侣。 如果你想快速看到它的运行效果,仓库中包含一个演示,该演示从公共视频 URL 开始转码,并自动打开播放: ```python python examples/demo.py ``` 我主要对 API 接口、硬件检测和实际转码的边缘情况感兴趣,欢迎大家提出反馈。
1作者: ryo_numoto4 天前
大家好,我是 The Tournament 的开发者,这是一个用于创建锦标赛对阵图和联赛积分榜的 Web 应用程序。<p><code> 多年来,它在日本被体育联盟、学校、电子竞技赛事和电视台广泛使用。我们最近增加了全面的多语言支持,现在正扩展到全球。 它的与众不同之处: - 直观的编辑 – 直接点击对阵图/积分榜即可输入结果,获胜者自动晋级 - 即时可用 – 无需注册即可试用,注册后可保存和管理您的表格 - 两种格式 – 单淘汰赛对阵图和循环赛联赛积分榜,自动计算排名 - 清晰的输出 – PDF 导出、通过 iframe 嵌入、在社交媒体上分享 - 国际化 – 国家标志、支持 9 种语言 免费版:对阵图最多 16 名选手,联赛最多 6 名 高级版(每月 5 美元):最多 128 名选手、无限保存、API 访问、无广告 我很乐意听取您希望添加的功能。欢迎随时提问!</code></pre>
1作者: throwaway20274 天前