1作者: soroucsh6 个月前
大家好,HN,我开发了 VectorVid,因为我反复看到团队将 Whisper + 向量数据库拼凑在一起,用于搜索网络研讨会和演示视频。<p>问题:您有 100 多个小时的视频。您希望为 RAG 建立索引。但流程很混乱——转录、帧采样、OCR、分块、嵌入,然后插入您自己的向量数据库。<p>VectorVid 只做一件事:视频 → RAG 就绪的 JSON。<p>输入:视频 URL(网络研讨会、讲座、演示) 输出:{ chunks: [{ start_sec, end_sec, text, scene_description, ocr_text, embedding }] }<p>工作原理:<p>转录 + 说话人分割(Whisper/Deepgram)<p>帧采样(1/5 秒)+ OCR(EasyOCR/Claude)<p>场景描述,用于视觉上下文<p>包含嵌入(OpenAI)<p>MVP 是一个实时演示——您可以在 2007 年的 iPhone 主题演讲中进行搜索,并查看确切的 JSON API 输出。<p>技术:Next.js 前端,异步处理,Supabase pgvector,部署在 Vercel 上。<p>我看到的应用场景:<p>SaaS 团队:“搜索我们的帮助视频” → 驱动内部搜索/聊天<p>教育科技:“学生找到特定的幻灯片” → 直接跳转到图表<p>销售:“定价幻灯片出现了吗?” → 自动化演示审计<p>需要早期反馈。试用演示,告诉我您会在此基础上构建什么。
3作者: zuhayeer6 个月前
很高兴分享我的新年项目。<p>长期以来,我一直想把 H-1B 数据直接整合到 Levels.fyi 中。每次我在其他地方寻找这些数据时,使用体验都很令人沮丧。大多数 H-1B 网站都显得过时、不直观、充斥着广告,或者用起来让人不知所措。数据是有的,但无法使用,而且绝对不好浏览。<p>因此,出于这种沮丧,我决定构建我个人想使用的 H-1B 数据体验。直接整合到 Levels.fyi 中。<p><a href="https:&#x2F;&#x2F;levels.fyi&#x2F;h1b&#x2F;" rel="nofollow">https:&#x2F;&#x2F;levels.fyi&#x2F;h1b&#x2F;</a><p>一些我感兴趣的其他页面:<p>工资热力图:<a href="https:&#x2F;&#x2F;www.levels.fyi&#x2F;h1b&#x2F;map&#x2F;wages&#x2F;" rel="nofollow">https:&#x2F;&#x2F;www.levels.fyi&#x2F;h1b&#x2F;map&#x2F;wages&#x2F;</a><p>公司 H-1B 足迹:<a href="https:&#x2F;&#x2F;www.levels.fyi&#x2F;h1b&#x2F;map&#x2F;company&#x2F;" rel="nofollow">https:&#x2F;&#x2F;www.levels.fyi&#x2F;h1b&#x2F;map&#x2F;company&#x2F;</a><p>薪资最高的 H-1B 职位:<a href="https:&#x2F;&#x2F;www.levels.fyi&#x2F;h1b&#x2F;jobs&#x2F;" rel="nofollow">https:&#x2F;&#x2F;www.levels.fyi&#x2F;h1b&#x2F;jobs&#x2F;</a><p>H-1B 热门城市:<a href="https:&#x2F;&#x2F;www.levels.fyi&#x2F;h1b&#x2F;city&#x2F;" rel="nofollow">https:&#x2F;&#x2F;www.levels.fyi&#x2F;h1b&#x2F;city&#x2F;</a><p>顶级公司赞助商:<a href="https:&#x2F;&#x2F;www.levels.fyi&#x2F;h1b&#x2F;sponsors&#x2F;" rel="nofollow">https:&#x2F;&#x2F;www.levels.fyi&#x2F;h1b&#x2F;sponsors&#x2F;</a><p>欢迎任何反馈,这绝对还在完善中。
3作者: pea6 个月前
我经常会有 5-10 分钟的空闲时间。很容易就浪费掉这些时间。<p>你们都喜欢利用这些时间做什么呢?<p>比如,学习一项新技能,把某件事做得更好一点,或者阅读高质量的内容。<p>补充说明一下,我指的不是在手机上做的事情!
8作者: jeffkumar6 个月前
我意识到,我在领英上有一批不错的联系人,今年我想对他们进行分组并进行联系。当我尝试下载所有数据时,我发现95%的联系人都没有电子邮件地址。于是我决定逐个浏览每个人的资料,查看联系信息,获取电子邮件,并填写我的电子表格。花了一个小时,我收集了大约200个联系人后,我收到了一个警告,说我正在使用自动化工具,需要点击以声明不再使用自动化工具。然而,我一开始根本就没有使用任何自动化工具。我手动从我的联系人列表中提取了可用的电子邮件。有没有其他人遇到过这种情况?有解决方案吗?
1作者: practicalaifg6 个月前
嗨,HN, 我发现自己花太多时间在科技新闻和 RSS 订阅源上“末日浏览”,浏览数百个标题,只为了找到 3-4 个真正对我的工作有用的内容。 为了解决这个问题,我使用 n8n 构建了一个自托管的自动化工作流程,它充当个人编辑。 架构: 摄取:每天早上拉取 RSS 订阅源(TechCrunch、Hacker News 等)。 过滤(代理):将标题传递给 GPT-4o-mini,并附带一个系统提示,要求其“充当高级编辑”。它根据特定兴趣(例如,“对本地 LLM 高度感兴趣”,“对加密货币八卦兴趣低”)对每篇文章进行 0-10 分的评分。 逻辑:丢弃任何得分低于 7 的内容。 研究:使用 Tavily API 抓取并总结高分文章的完整内容。 交付:通过 SMTP 发送一封干净的电子邮件摘要。 最难的部分(SSE 和超时):最大的技术障碍是处理超时。由于 AI 研究步骤需要时间,HTTP 请求经常会中断。我不得不配置服务器发送事件 (SSE) 并调整 Node.js 中的执行超时环境变量,以在深度研究阶段保持连接。 资源: 工作流程/源代码 (JSON):[https://github.com/sojojp-hue/NewsSummarizer/tree/main](https://github.com/sojojp-hue/NewsSummarizer/tree/main) 视频演练和演示:[https://youtu.be/mOnbK6DuFhc](https://youtu.be/mOnbK6DuFhc) 我很想听听其他人是如何处理信息过载的,或者是否有更好的方法来处理 AI 代理的长时间轮询。
4作者: wafflesfreak6 个月前
Traceformer.io 是一个 Web 应用程序,它能够导入 KiCad 项目或 Altium 网表以及相关的技术手册,从而实现基于 LLM 的原理图审查。该系统旨在识别传统 ERC 工具无法检测到的、由技术手册驱动的原理图问题。 自首次发布(原名 Netlist.io)以来,我们进行了一些重大更改: * 通过开源插件实现完整的 KiCad 项目解析 * 通行 API 定价,仅收取少量平台费用 * 自动技术手册检索 * ERC/DRC 风格的审查 UI * 改进的审查工作流程,可选择前沿模型(GPT 5.2、Opus 4.5 等) * 可配置的审查参数(令牌限制、设计规则和并行审查) 此外,我们继续提供免费套餐,让您可以在订阅之前评估设计。我们期待收到您的反馈!