1作者: yegemberdin9 个月前
大家好!我想和大家分享一下我们过去几个月一直在努力的一项很棒的成果。 我们找到了一种利用人工智能在画布上进行设计的方法,并且正在构建一个设计工具,它可以帮助完成各种任务,从探索不同的用户体验流程、布局,到构建设计系统等复杂任务。 如果你是一名设计师,或者过去从事过设计相关工作,我们非常希望得到你对哪些功能对你来说有用的反馈! 我们很快将向部分用户推出这款工具,希望能够为设计界带来价值。
1作者: amaan-mohib9 个月前
Hi HN, 我一直在开发一个名为 Delta Widgets 的项目,它是一个 Windows 桌面小部件制作工具。 想法:让创建和自定义小部件更简单,无需像使用 Rainmeter 那样编辑 .ini 文件或配置文件。您可以使用拖放构建器进行可视化设计,或者如果您想要更多控制,可以编写自己的 HTML/CSS/JS。 一些功能: * 拖放式小部件构建器(无需编码) * 或者从自定义 HTML/CSS 或实时 URL 加载小部件 * 支持动态数据,如时间、系统信息和媒体播放 * 预制模板,快速上手 * 基于 Tauri (Rust + 系统 WebView) 构建 → 轻量级、安全、原生体验 网站:[https://delta-widgets.vercel.app/](https://delta-widgets.vercel.app/) Product Hunt:[https://www.producthunt.com/products/delta-widgets?utm_source=other&utm_medium=social](https://www.producthunt.com/products/delta-widgets?utm_source=other&utm_medium=social) Peerlist:[https://peerlist.io/amaanmohib/project/delta-widgets](https://peerlist.io/amaanmohib/project/delta-widgets)
2作者: st-matskevich9 个月前
我最近在做唤醒词检测方面的工作,并提出了一种不同的方法来解决这个问题,所以我想分享一下我所构建的内容。 我开始着手一个在树莓派上集成MCP的智能助手项目,在唤醒词部分,我发现现有的开源解决方案有些局限。你必须选择经典的MFCC + DTW解决方案,但其精度不高,或者你必须使用基于模型的解决方案,这需要一个预先训练好的模型,而且你不能让用户使用他们自己的唤醒词。 所以我结合了这两种方法的优点,实现了我自己的解决方案。它使用谷歌的语音嵌入从音频中提取语音特征,这对于噪声和音调变化具有更强的抵抗力,并且适用于不同的说话者声音。然后,这些特征与DTW进行比较,这有助于避免时间上的错位。 在Qualcomm关键词语音数据集上的基准测试显示,对于同一说话者的检测,准确率为98.6%,对于跨说话者的检测,准确率为81.9%(尽管它不是为此用例设计的)。将模型转换为ONNX后,我的树莓派上的CPU使用率降低到10%。 令人惊讶的是,我还没有看到(至少目前还没有)其他人使用这种方法。所以我想分享一下,并听取大家的想法——是否有人尝试过类似的方法,或者发现了任何我可能忽略的明显问题? GitHub - <a href="https:&#x2F;&#x2F;github.com&#x2F;st-matskevich&#x2F;local-wake" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;st-matskevich&#x2F;local-wake</a>