1 分•作者: srichard16•9 个月前
返回首页
最新
1 分•作者: indigodaddy•9 个月前
1 分•作者: zdw•9 个月前
1 分•作者: DrMachiavel•9 个月前
1 分•作者: pjmlp•9 个月前
8 分•作者: yujonglee•9 个月前
大家好。我是 Hyprnote 团队的 Yujong(<a href="https://github.com/fastrepl/hyprnote" rel="nofollow">https://github.com/fastrepl/hyprnote</a>)。
我们构建 OWhisper 出于以下两个原因:
(也概述在 <a href="https://docs.hyprnote.com/owhisper/what-is-this" rel="nofollow">https://docs.hyprnote.com/owhisper/what-is-this</a>)
(1). 在使用设备端实时语音转文本功能时,我们发现没有现成的工具能够以实用方式下载/运行模型。
(2). 此外,我们经常收到请求,希望为 Hyprnote 桌面应用程序提供一种接入自定义 STT 端点的方法,就像使用与 OpenAI 兼容的 LLM 端点一样。
(2) 部分仍在开发中,但我们花了一些时间编写文档,因此如果您浏览一下,您将对它是什么样子有一个很好的了解。
对于 (1) - 您现在就可以尝试。(<a href="https://docs.hyprnote.com/owhisper/cli/get-started" rel="nofollow">https://docs.hyprnote.com/owhisper/cli/get-started</a>)
```bash
bash
brew tap fastrepl/hyprnote && brew install owhisper
owhisper pull whisper-cpp-base-q8-en
owhisper run whisper-cpp-base-q8-en
```
如果您对 Whisper 感到厌倦,我们也支持 Moonshine :)
试一试 (owhisper pull moonshine-onnx-base-q8)
我们在这里,期待您的反馈!
2 分•作者: bobsingor•9 个月前
我开发了 EmbedPDF:一个基于 MIT 许可证的开源 PDF 查看器,旨在免费提供 Adobe Acrobat 的所有付费功能。<p>已实现功能:<p>- 注释(高亮、便签、自由文本、墨迹)
- 真实内容编辑(实际移除内容)
- 搜索、文本选择、缩放、旋转
- 完全在浏览器中运行,无需服务器
- 可直接嵌入 React、Vue、Preact、原生 JS 的 SDK<p>为什么? Acrobat 臃肿、封闭且昂贵。我想要一个轻量级、可修改且可嵌入任何地方的工具。<p>演示:<a href="https://app.embedpdf.com/" rel="nofollow">https://app.embedpdf.com/</a>
网站:<a href="https://www.embedpdf.com/" rel="nofollow">https://www.embedpdf.com/</a>
GitHub:<a href="https://github.com/embedpdf/embed-pdf-viewer" rel="nofollow">https://github.com/embedpdf/embed-pdf-viewer</a><p>欢迎提供反馈、bug 报告和功能请求!
6 分•作者: mailyk•9 个月前
11 分•作者: mahmoud-almadi•9 个月前
大家好,我们是Mahmoud和Alan,正在构建Cyberdesk (<a href="https://www.cyberdesk.io/">https://www.cyberdesk.io/</a>),这是一个确定性的计算机使用代理,用于自动化Windows桌面应用程序。开发者使用我们来自动化医疗保健、会计、建筑等行业的遗留软件中的重复性任务,通过直接在桌面上执行点击和按键操作来实现。<p>这里有几个Cyberdesk计算机使用代理的演示:<p>快速完成文件导入自动化到遗留桌面应用程序:<a href="https://youtu.be/H_lRzrCCN0E" rel="nofollow">https://youtu.be/H_lRzrCCN0E</a><p>处理一个名为OpenDental的庞大Windows巨型程序(展示了代理的学习过程):<a href="https://youtu.be/nXiJDebOJD0" rel="nofollow">https://youtu.be/nXiJDebOJD0</a>。<p>填写W-2税表:<a href="https://youtu.be/6VNEzHdc8mc" rel="nofollow">https://youtu.be/6VNEzHdc8mc</a><p>许多行业仍然在使用遗留的Windows桌面应用程序,员工们饱受重复性任务的困扰,这些任务非常耗时。为这些应用程序提供自动化方案的供应商最终编写了脆弱的机器人流程自动化(RPA)脚本,或者聘请离岸团队进行手动任务执行。由于不可避免的UI更改或意外的弹出窗口(如Windows更新或应用程序内随机通知),RPA经常中断。离岸团队通常不可靠,而且比软件更昂贵,而且对于受监管的行业来说,它们并不总是一个选择。<p>我之前在一家财富100强公司构建了RPA脚本,影响了2万多名员工,在那里我亲身体验了RPA的脆弱性和不灵活性。对我来说,这显然是解决未解决问题的权宜之计。Alan在他的上一家创业公司中构建了一个计算机使用代理,并意识到它在自动化许多行业的大量手动计算机任务方面的巨大潜力,所以我们开始着手开发Cyberdesk。<p>计算机使用模型可能难以处理抽象的、长期的任务,但它们擅长于在屏幕上做出上下文感知的决策,因此它们非常适合自动化这些桌面应用程序。<p>可靠性的关键在于创建高度具体且经过深思熟虑的提示。就像使用ChatGPT一样,模糊或模棱两可的提示不会得到你想要的结果。对于计算机使用来说尤其如此,因为模型正在处理几乎整个桌面屏幕的额外视觉信息;如果没有精确的指令,它就不知道要关注哪些细节或如何行动。<p>与RPA不同,Cyberdesk的代理不会盲目地重放点击。它们会在每次操作之前读取屏幕状态,并在流程发生偏差时进行自我纠正(弹出窗口、延迟、UI更改)。与现成的计算机使用AI不同,Cyberdesk在生产环境中以确定性的方式运行:代理主要遵循它已经学习的步骤,并且仅在出现异常时才退回到推理。Cyberdesk从自然语言指令中学习工作流程,捕捉细微差别并处理动态任务——远远超出了对几次运行的简单屏幕录制所能编码的范围。<p>这种方法对可靠性和成本都有好处:可靠性,因为我们在意外情况下会退回到计算机使用模型;成本,因为计算机使用模型很昂贵,我们只在需要时才使用它们。否则,我们利用更快、更实惠的视觉LLM来逐步检查屏幕状态,在确定性运行期间。我们的代理还配备了故障保护、数据提取、屏幕评估等工具,以处理动态和敏感的情况。<p>工作原理:你在任何Windows机器上安装我们的开源驱动程序 (<a href="https://github.com/cyberdeyyoyoubackhackersk-hq/cyberdriver" rel="nofollow">https://github.com/cyberdeyyoyoubackhackersk-hq/cyberdriver</a>)。它与我们的后端通信以接收命令(点击、输入、滚动、截图),并发送回数据(截图、API响应等)。你为我们的计算机使用代理提供一个给定任务的详细的自然语言描述,就像为第一次学习新任务的员工提供的标准操作程序一样。然后,代理利用计算机使用AI模型来学习步骤,并通过保存每个截图及其操作(点击这些坐标、输入XYZ、等待页面加载等)来记住它们。<p>代理以确定性的方式运行这些步骤,以实现快速和可预测的运行。为了应对弹出窗口和UI更改,我们的代理会将实时屏幕状态与记忆状态进行比较,以确定是否可以安全地执行记忆步骤。如果没有重大更改阻止安全执行记忆步骤,它将继续进行;否则,它将退回到计算机使用模型,并提供关于过去操作和剩余任务的上下文。<p>客户目前正在使用我们来执行手动任务,例如从遗留桌面应用程序导入和导出文件、在桌面PMS上为患者预约,以及数据录入,用于填写EMR中的表格,如患者资料等。<p>我们还没有自助服务选项,但我们很乐意手动为你提供服务。在这里预约演示以了解更多信息!(<a href="https://www.cyberdesk.io/">https://www.cyberdesk.io/</a>)
如果你更愿意等待稍后推出的自助服务选项,请在此处提交你的电子邮件 (<a href="https://forms.gle/HfQLxMXKcv9Eh8Gs8" rel="nofollow">https://forms.gle/HfQLxMXKcv9Eh8Gs8</a>),以便在准备就绪时收到通知。
你也可以在这里查看我们的文档:<a href="https://docs.cyberdesk.io/">https://docs.cyberdesk.io/</a>。<p>我们非常乐意听取你对我们方法和遗留行业桌面自动化的看法!
18 分•作者: tombert•9 个月前
我刚被一家公司拒绝了,这让我非常恼火,比我预想的还要严重。(在我的律师(ChatGPT)的建议下,我不会透露这家公司的名字。)
这真的让我很生气;我花了四周时间做了三次面试,而且我相当确定我的技术问题都答对了。可能是我的简历太“跳跃”了,这很合理,但他们本可以在浪费我和他们自己的时间,进行三次耗时数小时的面试之前,先看看我的简历。
我唯一能想到的就是他们在面试中不喜欢我的个性,这真的最让人沮丧。如果我在技术部分搞砸了,那我可以努力学习更多技术知识来改进,但我不太确定我的个性到底在面试中出了什么问题,更不确定我应该怎么改变它。
很难保持动力,但我想我别无选择,因为我仍然需要支付我的抵押贷款,所以我很好奇这里有没有人能提供一些建议,告诉我如何最好地调整我的个性,以便在面试中表现更好?最好我能保持诚实(即使仅仅是因为我是一个非常糟糕的骗子)。
58 分•作者: whicks•9 个月前
3 分•作者: Igor_Wiwi•9 个月前
1 分•作者: suayip•9 个月前
大家好,
我一直在为 Django REST framework 开发新的 Filter 后端。
目前,用于过滤和查询参数处理的事实标准库是 django-filter,但我在一些用例中发现它存在不足。以下是它的一些特性:
* 您可以使用序列化器字段进行解析和验证。无需再处理 Django 表单和组件。
* 您可以对过滤器进行分组。分组允许您自定义过滤器之间的交互。
* 您可以使用约束系统在过滤器之间执行验证。
* 您可以创建带有子过滤器的嵌套过滤器。
... 还有更多。在文档中,我解释了这些选择背后的原因,并提供了一些实际示例。请查看:
我希望看到您对此的评论。我接受建议和推荐。谢谢!
2 分•作者: todsacerdoti•9 个月前
2 分•作者: edent•9 个月前
1 分•作者: edelsohn•9 个月前
2 分•作者: tortilla•9 个月前
1 分•作者: severusdd•9 个月前
1 分•作者: edelsohn•9 个月前
1 分•作者: aguacero7•9 个月前