2 分•作者: laminarflow027•12 个月前
在这篇文章中,我们记录了一些实验的结果,比较了原始的图 RAG(仅单次 text2cypher)与路由代理图 RAG 方法,后者可以调用向量搜索工具以及 text2cypher。路由代理使用 LLM 来决定调用哪个向量搜索工具,这取决于问题中识别出的术语,并且效果很好。
结果表明,像 `gpt-4.1` 这样的最新前沿 LLM 和可靠的“老将” `gemini-2.0-flash` 能够可靠且可重复地生成高质量的 Cypher 代码,只需进行一些提示工程,以确保图模式在 text2cypher 提示中格式良好。在一组包含 10 个测试查询(这些查询适度复杂,需要从知识图中检索路径)中,当将路由代理添加到工作流程以增强原始图 RAG 时,`gpt-4.1` 和 `gemini-2.0-flash` 通过了所有测试,生成了正确的答案。
提示工程使用 BAML 完成(一种编程语言,可以简化提示 LLM 并从它们那里获得结构化输出,适用于所有实验)。事实上,知识图本身是使用 BAML 提示构建的,这些提示从上游的非结构化数据中提取实体和关系。
此工作流程的下一个逻辑步骤是构建更复杂的代理循环,这些循环可以运行多步 Cypher 查询,其结果可以合并以回答更难的问题(类似于人类处理问题的方式)。测试和评估的一般原则也适用于此。 看来进一步探索这些方法很有前景!