1 分•作者: martey•4 天前
返回首页
最新
1 分•作者: brandonb•4 天前
1 分•作者: matt_d•4 天前
1 分•作者: maguszin•4 天前
2 分•作者: 2dogsanerd•4 天前
过去几个月,我一直在为受监管环境设计一个 RAG 系统。我不是专业开发人员,但我以严格的“系统工程”和审计思维来构建它。
虽然大多数教程止步于“LangChain + VectorDB”,但我发现,要使其在法律上站得住脚并在运营上保持稳定,需要大约 40 多个额外的组件。
我们从一个简单的摄取脚本转移到“多车道共识引擎”(灵感来自六西格玛),因为标准的 OCR/提取对于我们的用例来说,太容易产生幻觉了。
我们不得不构建广泛的审计、细化到文档级别的 RBAC,以及混合图数据库+向量检索,以获得可接受的准确性。
目前的架构包括:
摄取:4 个并行提取车道(视觉、布局、文本、法律),带有一个共识引擎(“Solomon”),该引擎仅索引由多个来源确认的数据
检索:混合 Neo4j(图数据库)+ ChromaDB(向量数据库),采用互易秩融合
性能:语义缓存(Redis),专门用于含义相似的查询(加速 40 倍)
安全性:完整的 RBAC、对每个提示/检索的审计日志记录以及 PII 屏蔽。
我记录了完整的功能列表和差距分析
[https://gist.github.com/2dogsandanerd/2a3d54085b2daaccbb1125601945ceeb](https://gist.github.com/2dogsandanerd/2a3d54085b2daaccbb1125601945ceeb)
我向社区提出的问题是:
看看这个列表——“稳健的生产工程”和“过度工程”之间的界限在哪里?
对于那些从事金融科技/医疗科技 RAG 的人来说:我还在这个列表中遗漏了哪些关键的失效模式?
6 分•作者: MrSkelter•4 天前
2 分•作者: Omakidx•4 天前
我刚刚重新搭建了我的个人作品集。
2 分•作者: BleedingXiko•4 天前
Hi HN,
我在开发自托管媒体服务器时,希望找到一种简单的方法,将视频转码任务分流到网络上可用的硬件,于是构建了 GhostStream。
GhostStream 是一个开源视频转码服务器,具有以下特点:
* 零配置启动
* 自动 GPU / 编码器检测(NVENC, QuickSync, AMF, VideoToolbox)
* 实时 HLS 流媒体、ABR 和批量模式
* 如果硬件编码失败,自动回退到 CPU
* 一个用于进度更新的小型 HTTP + WebSocket API
它设计为在本地运行(无云依赖),并且非常适合作为轻量级媒体服务器的伴侣。
如果你想快速看到它的运行效果,仓库中包含一个演示,该演示从公共视频 URL 开始转码,并自动打开播放:
```python
python examples/demo.py
```
我主要对 API 接口、硬件检测和实际转码的边缘情况感兴趣,欢迎大家提出反馈。
49 分•作者: anttiharju•4 天前
124 分•作者: birdculture•4 天前
13 分•作者: mdahardy•4 天前
1 分•作者: rayruiwang•4 天前
1 分•作者: toomuchtodo•4 天前
1 分•作者: zora_goron•4 天前
1 分•作者: ryo_numoto•4 天前
大家好,我是 The Tournament 的开发者,这是一个用于创建锦标赛对阵图和联赛积分榜的 Web 应用程序。<p><code> 多年来,它在日本被体育联盟、学校、电子竞技赛事和电视台广泛使用。我们最近增加了全面的多语言支持,现在正扩展到全球。
它的与众不同之处:
- 直观的编辑 – 直接点击对阵图/积分榜即可输入结果,获胜者自动晋级
- 即时可用 – 无需注册即可试用,注册后可保存和管理您的表格
- 两种格式 – 单淘汰赛对阵图和循环赛联赛积分榜,自动计算排名
- 清晰的输出 – PDF 导出、通过 iframe 嵌入、在社交媒体上分享
- 国际化 – 国家标志、支持 9 种语言
免费版:对阵图最多 16 名选手,联赛最多 6 名
高级版(每月 5 美元):最多 128 名选手、无限保存、API 访问、无广告
我很乐意听取您希望添加的功能。欢迎随时提问!</code></pre>
1 分•作者: throwaway2027•4 天前
1 分•作者: protoduction•4 天前
1 分•作者: d4n3ws•4 天前
2 分•作者: yakkomajuri•4 天前
1 分•作者: chrisjj•4 天前