1 分•作者: soroucsh•6 个月前

大家好，HN，我开发了 VectorVid，因为我反复看到团队将 Whisper + 向量数据库拼凑在一起，用于搜索网络研讨会和演示视频。问题：您有 100 多个小时的视频。您希望为 RAG 建立索引。但流程很混乱——转录、帧采样、OCR、分块、嵌入，然后插入您自己的向量数据库。VectorVid 只做一件事：视频 → RAG 就绪的 JSON。输入：视频 URL（网络研讨会、讲座、演示）输出：{ chunks: [{ start_sec, end_sec, text, scene_description, ocr_text, embedding }] }工作原理：转录 + 说话人分割（Whisper/Deepgram）帧采样（1/5 秒）+ OCR（EasyOCR/Claude）场景描述，用于视觉上下文包含嵌入（OpenAI）MVP 是一个实时演示——您可以在 2007 年的 iPhone 主题演讲中进行搜索，并查看确切的 JSON API 输出。技术：Next.js 前端，异步处理，Supabase pgvector，部署在 Vercel 上。我看到的应用场景：SaaS 团队：“搜索我们的帮助视频” → 驱动内部搜索/聊天教育科技：“学生找到特定的幻灯片” → 直接跳转到图表销售：“定价幻灯片出现了吗？” → 自动化演示审计需要早期反馈。试用演示，告诉我您会在此基础上构建什么。

Show HN: H-1B 签证工资数据浏览器

3 分•作者: zuhayeer•6 个月前

很高兴分享我的新年项目。长期以来，我一直想把 H-1B 数据直接整合到 Levels.fyi 中。每次我在其他地方寻找这些数据时，使用体验都很令人沮丧。大多数 H-1B 网站都显得过时、不直观、充斥着广告，或者用起来让人不知所措。数据是有的，但无法使用，而且绝对不好浏览。因此，出于这种沮丧，我决定构建我个人想使用的 H-1B 数据体验。直接整合到 Levels.fyi 中。<a href="https://levels.fyi/h1b/" rel="nofollow">https://levels.fyi/h1b/</a>一些我感兴趣的其他页面：工资热力图：<a href="https://www.levels.fyi/h1b/map/wages/" rel="nofollow">https://www.levels.fyi/h1b/map/wages/</a>公司 H-1B 足迹：<a href="https://www.levels.fyi/h1b/map/company/" rel="nofollow">https://www.levels.fyi/h1b/map/company/</a>薪资最高的 H-1B 职位：<a href="https://www.levels.fyi/h1b/jobs/" rel="nofollow">https://www.levels.fyi/h1b/jobs/</a>H-1B 热门城市：<a href="https://www.levels.fyi/h1b/city/" rel="nofollow">https://www.levels.fyi/h1b/city/</a>顶级公司赞助商：<a href="https://www.levels.fyi/h1b/sponsors/" rel="nofollow">https://www.levels.fyi/h1b/sponsors/</a>欢迎任何反馈，这绝对还在完善中。

提问 HN：你如何高效利用 5-10 分钟的空闲时间？

3 分•作者: pea•6 个月前

我经常会有 5-10 分钟的空闲时间。很容易就浪费掉这些时间。你们都喜欢利用这些时间做什么呢？比如，学习一项新技能，把某件事做得更好一点，或者阅读高质量的内容。补充说明一下，我指的不是在手机上做的事情！

LinkedIn 阻止你被“封号”

8 分•作者: jeffkumar•6 个月前

我意识到，我在领英上有一批不错的联系人，今年我想对他们进行分组并进行联系。当我尝试下载所有数据时，我发现95%的联系人都没有电子邮件地址。于是我决定逐个浏览每个人的资料，查看联系信息，获取电子邮件，并填写我的电子表格。花了一个小时，我收集了大约200个联系人后，我收到了一个警告，说我正在使用自动化工具，需要点击以声明不再使用自动化工具。然而，我一开始根本就没有使用任何自动化工具。我手动从我的联系人列表中提取了可用的电子邮件。有没有其他人遇到过这种情况？有解决方案吗？

谢菲尔德项目旨在建立英国首个电子游戏档案

1 分•作者: 1659447091•6 个月前

值得一看的 Amiga 桌面

1 分•作者: ibobev•6 个月前

思考日记，每日解谜之旅

1 分•作者: TrianguloY•6 个月前

蝎子：JSON的直接操作转换

1 分•作者: andsoitis•6 个月前

Show HN: 我搭建了一个个人 AI 新闻聚合器，用于过滤 RSS 订阅源（n8n 和 OpenAI）

1 分•作者: practicalaifg•6 个月前

嗨，HN，我发现自己花太多时间在科技新闻和 RSS 订阅源上“末日浏览”，浏览数百个标题，只为了找到 3-4 个真正对我的工作有用的内容。为了解决这个问题，我使用 n8n 构建了一个自托管的自动化工作流程，它充当个人编辑。架构：摄取：每天早上拉取 RSS 订阅源（TechCrunch、Hacker News 等）。过滤（代理）：将标题传递给 GPT-4o-mini，并附带一个系统提示，要求其“充当高级编辑”。它根据特定兴趣（例如，“对本地 LLM 高度感兴趣”，“对加密货币八卦兴趣低”）对每篇文章进行 0-10 分的评分。逻辑：丢弃任何得分低于 7 的内容。研究：使用 Tavily API 抓取并总结高分文章的完整内容。交付：通过 SMTP 发送一封干净的电子邮件摘要。最难的部分（SSE 和超时）：最大的技术障碍是处理超时。由于 AI 研究步骤需要时间，HTTP 请求经常会中断。我不得不配置服务器发送事件 (SSE) 并调整 Node.js 中的执行超时环境变量，以在深度研究阶段保持连接。资源：工作流程/源代码 (JSON)：[https://github.com/sojojp-hue/NewsSummarizer/tree/main](https://github.com/sojojp-hue/NewsSummarizer/tree/main) 视频演练和演示：[https://youtu.be/mOnbK6DuFhc](https://youtu.be/mOnbK6DuFhc) 我很想听听其他人是如何处理信息过载的，或者是否有更好的方法来处理 AI 代理的长时间轮询。

十年 Mac 用户转投 Linux

2 分•作者: cickpass_broken•6 个月前

Telegram 转发器

1 分•作者: linuxmaster14•6 个月前

C-Sentinel：系统探测器，捕获“系统指纹”以供 AI 分析

2 分•作者: indigodaddy•6 个月前

Keeper：开源日历同步

3 分•作者: handfuloflight•6 个月前

埃罗尔·莫里斯的“审讯机”

1 分•作者: rafaepta•6 个月前

Show HN: 基于 LLM 的 PCB 原理图检查器（重大更新）

4 分•作者: wafflesfreak•6 个月前

Traceformer.io 是一个 Web 应用程序，它能够导入 KiCad 项目或 Altium 网表以及相关的技术手册，从而实现基于 LLM 的原理图审查。该系统旨在识别传统 ERC 工具无法检测到的、由技术手册驱动的原理图问题。自首次发布（原名 Netlist.io）以来，我们进行了一些重大更改： * 通过开源插件实现完整的 KiCad 项目解析 * 通行 API 定价，仅收取少量平台费用 * 自动技术手册检索 * ERC/DRC 风格的审查 UI * 改进的审查工作流程，可选择前沿模型（GPT 5.2、Opus 4.5 等） * 可配置的审查参数（令牌限制、设计规则和并行审查）此外，我们继续提供免费套餐，让您可以在订阅之前评估设计。我们期待收到您的反馈！

有人用过音频感应环路吗？

25 分•作者: evolve2k•6 个月前

北达科他州法律依据煤炭律师的名字，列出了虚假的“关键矿物”清单。

49 分•作者: randycupertino•6 个月前

增长必然毁灭地球吗？

1 分•作者: andsoitis•6 个月前

申请破产保护（第七章）会增加汽车贷款的难度

2 分•作者: petethomas•6 个月前

ChatGPT 之后的教育

1 分•作者: fromwilliam•6 个月前

上一页 1...2739 2740 2741 2742 2743...5601 下一页

最新