3 分•作者: pablo24602•5 天前
返回首页
一周热榜
3 分•作者: almet•2 天前
3 分•作者: ryan_j_naughton•2 天前
3 分•作者: harambae•2 天前
3 分•作者: billybuckwheat•2 天前
3 分•作者: ayaansst•5 天前
3 分•作者: koolba•2 天前
3 分•作者: jjenkins•6 天前
3 分•作者: cicdw•7 天前
3 分•作者: DanielGarza•3 天前
3 分•作者: exceptione•5 天前
3 分•作者: yashwantphogat•3 天前
我对大家使用代码审查(PR review)的体验很感兴趣,包括人工审查和自动化审查。
对于使用过 PR 审查工具或机器人的人:
* 你们觉得哪些功能真正有帮助?
* 哪些功能最终变得令人讨厌或适得其反?
* 你们在什么时候开始不再关注反馈意见?
我特别想了解大家是如何在审查中平衡“有效信息”和“噪音”的,以及摘要、行内注释或选择性深度审查哪种方式在实践中效果更好。
我只是想了解真实的使用模式和痛点,而不是为了推广任何东西。 欢迎大家分享经验。
3 分•作者: olyellybelly•6 天前
3 分•作者: matteo1782•7 天前
Hi HN,
我开发了 EdgeVec,一个完全在浏览器中运行的向量数据库。它实现了 HNSW(分层可导航小世界)图,用于近似最近邻搜索。
性能:
* 在 10 万个向量(768 维,k=10)上,搜索时间小于毫秒级
* 148 KB gzipped 压缩包
* 使用标量量化后,内存减少 3.6 倍
用例:带有语义搜索的浏览器扩展、本地优先应用程序、保护隐私的 RAG。
技术细节:使用 Rust 编写,编译成 WASM。在原生环境下使用 AVX2 SIMD,在 WASM 环境下使用 simd128。使用 IndexedDB 进行浏览器持久化存储。
npm: [https://www.npmjs.com/package/edgevec](https://www.npmjs.com/package/edgevec)
GitHub: [https://github.com/matte1782/edgevec](https://github.com/matte1782/edgevec)
这是一个 Alpha 版本。主要限制:构建时间未优化,尚未支持删除操作。
欢迎社区提供反馈!
3 分•作者: voxadam•3 天前
3 分•作者: saran-damm•5 天前
我开发了 depup,一个命令行工具,用于扫描 Python 依赖项、检查 PyPI 版本、分类升级影响,并支持 CI 工作流程。
文档:<a href="https://saran-damm.github.io/depup/" rel="nofollow">https://saran-damm.github.io/depup/</a>
代码库:<a href="https://github.com/saran-damm/depup/" rel="nofollow">https://github.com/saran-damm/depup/</a>
3 分•作者: kstonekuan•5 天前
Tambourine 是一个开源的、完全可定制的语音听写系统,它允许你控制 STT/ASR、LLM 格式化和提示,以便将干净的文本插入到任何应用程序中。
我已经在业余时间构建这个系统几周了。 促使我构建它的原因是,我想要一个可定制的 Wispr Flow 版本,在那里我可以完全控制模型的行为、格式化和系统的运作方式,而不是依赖于一个黑盒。
Tambourine 直接构建在 Pipecat 之上,并依赖于其模块化的语音代理框架。 后端是一个本地 Python 服务器,它使用 Pipecat 将 STT 和 LLM 模型拼接成一个单一的管道。 这种模块化使得交换提供商、试验不同的设置以及对语音 AI 进行细粒度控制变得容易。
我与朋友分享了一个早期版本,最近还在我当地的 Claude Code 聚会上进行了展示。 反响非常积极,这鼓励我更广泛地分享它。
桌面应用程序是用 Tauri 构建的。 前端用 TypeScript 编写,而 Tauri 层使用 Rust 来处理底层系统集成。 这使得全局热键的注册、音频设备的管理以及在 Windows 和 macOS 上光标处的可靠文本输入成为可能。
从高层次来看,Tambourine 为你提供了一个跨操作系统的通用语音界面。 你按下全局热键,说话,格式化后的文本就会直接在你的光标处输入。 它适用于电子邮件、文档、聊天应用程序、代码编辑器和终端。
在幕后,音频通过 WebRTC 从 TypeScript 前端流式传输到 Python 服务器。 服务器使用可配置的 STT 提供商进行实时转录,然后将转录文本传递给 LLM,LLM 会删除填充词、添加标点符号,并应用自定义格式化规则和个人词典。 STT 和 LLM 提供商以及提示可以在不重启应用程序的情况下切换。
该项目仍在积极开发中。 我正在处理边缘情况并完善用户体验,并且可能会有重大更改,但大多数核心功能已经运行良好,并已成为我日常工作流程的一部分。
我非常感谢反馈,特别是来自任何对语音作为界面未来感兴趣的人。
3 分•作者: peeyek•6 天前
3 分•作者: qzcanoe•5 天前
PhotoToVideoAI 是一款由人工智能驱动的工具,可以将您的照片转化为动态视频。上传一张照片和一个提示词,大约 30 秒后,您将获得一个高质量的视频,分辨率高达 1080p,时长为 5 或 10 秒。该工具专为内容创作者、市场营销人员和摄影师设计。欢迎提供反馈!
3 分•作者: bookofjoe•7 天前