1 分•作者: PaulHoule•6 个月前
返回首页
最新
2 分•作者: nullwiz•6 个月前
Audiopipe 是一款用于降噪、说话人分割和转录的单行代码工具,集成了 demucs、pyannote 和 insanely-fast-whisper。
我用它来转录播客和龙与地下城游戏,觉得它可能也对大家有用。
它还有一个 WASM 界面,可以加载转录文本和音频。欢迎贡献!欢迎提供反馈。
8 分•作者: ColinWright•6 个月前
17 分•作者: elvis70•6 个月前
19 分•作者: marcusestes•6 个月前
54 分•作者: bearsyankees•6 个月前
5 分•作者: mfiguiere•6 个月前
2 分•作者: eatonphil•6 个月前
1 分•作者: ratsbane•6 个月前
1 分•作者: thomasbetous•6 个月前
1 分•作者: Anon84•6 个月前
1 分•作者: necrodome•6 个月前
2 分•作者: da02•6 个月前
1 分•作者: smoqadam•6 个月前
1 分•作者: miki_tyler•6 个月前
我正在探索使用仅由印刷元件构成的简单无线电接收器的想法:
* 导电走线:银纳米颗粒墨水
* 电阻器:碳基墨水
* 电感器:印刷螺旋线圈
* 电容器:叉指结构或堆叠层
我知道像 Dimatix DMP-2850 和 Optomec Aerosol Jet 这样的打印机,但我对改造标准喷墨打印机更感兴趣。
这里有人尝试过类似的东西吗?我很想听听关于设置、材料、挑战或您推荐的任何资源的信息。
2 分•作者: tzury•6 个月前
2 分•作者: rokeyzhang•6 个月前
现已在 iOS 上线:
<a href="https://itunes.apple.com/app/id6499280064" rel="nofollow">https://itunes.apple.com/app/id6499280064</a>
我们在疫情期间开始接触精品咖啡,和许多人一样,也深陷其中。在这个过程中,我们遇到了同样的困扰:
- 抽屉里堆满了空咖啡袋。
- 没有简单的方法按咖啡豆追踪研磨度、养豆日期、笔记。
- 我的咖啡历史分散在照片、截图、笔记本和模糊的记忆中。
- 每款咖啡独特的特性、人物和故事,在售罄后就会从互联网上消失(因为咖啡是一种农产品)。
- 在我们看来,从设计角度来看,没有一款咖啡工具真正捕捉到优质咖啡的风味、情感和美学。
所以我们开发了 BeanBook——一款咖啡笔记本,可以记录咖啡豆、提取冲泡配方,并通过 AI 在一个地方整理你的咖啡生活,只需轻轻一拍。
它的功能如下:
- 拍摄咖啡袋 → 自动检测烘焙商、产地、处理方式、烘焙日期、笔记、生产者、庄园等信息。
- 粘贴 YouTube 链接或照片 → 自动提取结构化的冲泡配方。
- 记录研磨度、烘焙时间线、评分和笔记 → 所有内容都保存在简洁优雅的 UI 中。
- 查看你的咖啡年度回顾 → 追踪习惯、趋势和最爱。
- 向 BeanBook AI 提问 → 从冲泡温度到咖啡豆知识,获得即时答案。
我和我的联合创始人一起完成了所有工作——品牌、代码和用户体验设计。如果你喜欢咖啡(或者想更多地了解咖啡),我们很乐意听取你的反馈。
- Rokey & Eric
31 分•作者: denysvitali•6 个月前
3 分•作者: msencenb•6 个月前
我的孩子还没到需要接触电子屏幕的年龄,但迟早会接触。我希望给他们提供有趣的电脑体验,而不是让他们只是对着 iPad 看视频。<p>我小时候对探索文件系统、研究应用程序的工作原理、玩 Kid Pix、Paint 和一些游戏(大致是 Apple IIGS、Macintosh 2 到 iMac + Windows XP 桌面)有着美好的回忆。<p>你手头有任何有趣的老式笔记本电脑或设备,你曾用它们来引导孩子们进入桌面环境吗?<p>欢迎提出任何建议 :)
28 分•作者: jamesxv7•6 个月前
首先,这纯粹是一个我个人的学习项目,旨在结合我的三大爱好:摄影、软件工程和我的家庭回忆。我有一个庞大的家庭照片集,想构建一个交互式体验来探索它们,类似于 Google 或 Apple 照片的功能。<p>我的目标是创建一个具有智能搜索功能的系统,其中一个最重要的要求是它必须完全在我的本地硬件上运行。隐私是关键,但主要的驱动力是自己动手构建它的挑战和乐趣(显然是为了学习)。<p>我想要实现的关键功能包括:<p>自动识别和标记家庭成员(本地人脸识别)。<p>为每张照片生成描述性标题。<p>自然语言搜索(例如,“给我看看去年夏天我们在 Luquillo 海滩的照片”)。<p>我已经向 AI 工具咨询了一个高层次的项目计划,它们提供了一个可靠的蓝图(例如,使用 LLaVA 的 Ollama,像 ChromaDB 这样的向量数据库,你懂的)。现在,我非常感兴趣于真实的、人类的体验。我正在寻找建议、学习故事,以及只有在构建类似东西时才会出现的细节。<p>对于 2025 年这样的项目,您会推荐哪些工具、模型和最佳实践?具体来说,我很好奇如何将结构化元数据(EXIF)、人脸识别数据和语义向量搜索结合到一个统一的应用程序中。<p>非常感谢任何建议!