4作者: astronautmonkey9 个月前
大家好,HN!我正在构建 Agora,一个用于电子商务的 AI 搜索引擎,能在 300 毫秒内返回搜索结果。我们已经索引了来自 10 万家店铺的 3000 万种商品,并使用 AI 智能体让购买变得更简单。<p>在 HN 上发布后,一家大型企业联系我们,希望付费获取原始数据。我们手动履行了合同,以了解确切的工作流程,然后决定将“数据连接器”产品化,以帮助我们扩展到更多客户。<p>数据连接器使开发人员能够从我们的索引中选择 10 万家店铺中的任何一家,查看样本数据,格式化输出,并导出最新的数据。数据可以导出为 CSV 或 JSON 格式。<p>我们已经为 Shopify、WooCommerce、Squarespace、Wix 和定制店铺构建了爬虫,以索引店铺信息、产品数据、库存、评论等。主要的技术挑战是每 24 小时重新抓取整个数据集。我们通过一系列服务器来完成这项工作,这些服务器使用轮换的本地代理“重新抓取”不同类型的店铺,然后将更改添加到队列中,以便在我们的搜索引擎索引中更新。我们的主要数据库是 Mongo,我们的搜索运行在具有高 RAM 的服务器上自托管的 Meilisearch 上。<p>我的愿景是索引全球的电子商务数据。我相信这将为客户、开发人员和商家创造市场效率。<p>我希望得到您的反馈!
1作者: sortafreel9 个月前
一个 VSCode/Cursor 扩展,用于复制选定行的相对路径 + 行号格式 (@src/extension.ts#L10-12),使用 cmd+alt+l 快捷键。<p>目标是为编码助手提供有限的上下文,而无需提及整个文件,从而节省上下文窗口。<p>高度特定的用例,小巧的开源代码(1 个文件)。如果它有价值,将发布到市场。<p>附注:现有的扩展程序已经有几百次下载了,但它们要么只复制单行,要么使用不同的格式,所以重新写一个更快。