4作者: tudorizer9 个月前
在编写代码的单一背景下,纵观历史,我们已经尝试过很多次生成代码。通常情况下,这些尝试都受到非常严格的约束。 生成式人工智能(GenAI)也属于同一领域,但它具有额外的步骤、优势和劣势。它不是“一个初级开发人员”,而是一把新锤子。 工匠喜欢新锤子,会不断挑战它的极限,并对其中的复杂性着迷。工具在使用寿命和成本方面都有局限性。 初级开发人员是人类,他们希望生存和发展。他们比大多数人更快地掌握新工具。唯一的障碍和过去一样:获得这些工具的途径以及对结果的可见性。 过度拟人化一把锤子的好处是什么?
15作者: zaidqureshi9 个月前
大家好,我们是Zaid、Muhammad和Hammad,Uplift AI(<a href="https:&#x2F;&#x2F;upliftai.org">https:&#x2F;&#x2F;upliftai.org</a>)的联合创始人。我们构建了能够说服务欠缺语言的模型——目前包括乌尔都语、信德语和俾路支语。<p>全球有十亿人无法阅读。在像巴基斯坦这样的国家——世界第五人口大国——42%的成年人是文盲。这阻碍了整个经济的发展:病人无法阅读医疗报告,家长无法辅导作业,银行无法实现全面数字化,农民无法研究最佳实践,人们只能记住智能手机应用程序的按钮序列。语音AI界面可以解决所有这些问题,我们认为这或许将成为现代AI的一大益处。<p>目前,现有的语音模型几乎无法用于这些语言,而大型科技公司进展缓慢。<p>Uplift AI最初是一个副业项目,旨在为翻译和语音模型创建数据集。对我们来说,这只是一个可以做的“很酷的副业”,而不是一个需要全职投入的“重要事情”。通过一些初始数据,我们在Whatsapp上拼凑了一个乌尔都语语音机器人,并将其提供给一位家政工人。两天内就有800人开始使用它。当我们深入了解用户时,我们了解到文本界面对很多人来说是行不通的。所以我们开始全职运营Uplift AI来解决这个问题。<p>最具挑战性的部分是,构建优秀语音模型所需的所有基本组件对于这些语言来说都是残缺的。例如,如果你正在创建一个语音合成模型,你会从YouTube上抓取大量数据,并使用转录模型对其进行自动标注……这在英语中很容易做到。但在服务欠缺的语言中却行不通,因为转录模式不够准确。<p>还有许多其他挑战。例如,当你雇佣人工转录员来标注数据时,他们通常没有任何针对其语言的拼写校正器,这会在数据中产生大量噪声……使得用少量数据训练模型变得困难。在音素、静音检测、变音符号等方面也存在更多挑战。<p>我们通过创建出色的内部工具来帮助数据标注来解决这些问题。此外,我们自己获取数据,而不是购买。这有悖常理,但相对于购买数据然后进行训练的公司来说,这是一个很大的优势。通过自己获取数据,我们创建了正确的数据分布,并用更少的数据获得了更好的模型。通过完全内部化(数据、标注、训练、部署),我们能够更快地取得进展。<p>今天,我们公开提供乌尔都语、信德语和俾路支语的文本转语音API。这是一个展示这一点的视频:<a href="https:&#x2F;&#x2F;www.loom.com&#x2F;share&#x2F;dcd5020967444c228e9c127151e7a9f5" rel="nofollow">https:&#x2F;&#x2F;www.loom.com&#x2F;share&#x2F;dcd5020967444c228e9c127151e7a9f5</a>。<p>可汗学院正在使用我们的技术将视频配音成乌尔都语(<a href="https:&#x2F;&#x2F;ur.khanacademy.org" rel="nofollow">https:&#x2F;&#x2F;ur.khanacademy.org</a>)。<p>我们的模型在信息性用例(如AI机器人)方面表现出色,但在情感性用例(如诗歌)方面还需要更多努力。<p>我们一直在以Beta模式向许多人提供私人访问权限,今天我们将我们的模型公开发布。我们相信这将是我们了解表现不佳的领域并迅速修复它们的最快方式。<p>我们很乐意听到大家的反馈,特别是关于您在使用服务欠缺语言方面的经验(不仅仅是我们开始使用的巴基斯坦语言),以及您的一般评论。
4作者: huey779 个月前
嗨 HN, 我是 Chris,一个来自澳大利亚墨尔本的独立开发者。过去一个月,我一直在利用下班后的时间开发 AgentVisa。今天能和大家分享它,我既兴奋(也承认有点紧张)。 我花了很多时间思考 AI 智能体的未来,实验越多,我越意识到我是在一个脆弱的基础上构建。我们如何建立对这些系统的信任?我们如何知道我们的智能体在做什么,以及谁授权了它们? 我的长期愿景是为开发者提供一个“智能体地图集”——一个清晰的智能体工作队伍地图,显示它们要去哪里以及被授权做什么。我今天推出的 MVP 是第一步。 核心想法很简单:停止给智能体一个永久的“护照”(一个静态 API 密钥),开始为每个特定任务给它们一个临时的“工作签证”。AgentVisa 是一个简单的 API,它颁发安全、短期的凭证,将智能体的任务链接回特定用户和一组权限。 为了让这更具体,我准备了一个演示,你可以在本地运行,展示一个智能体客服机器人如何使用 AgentVisa 访问内部 API。你可以在这里看到它:[https://github.com/AgentVisa/agentvisa-customer-support-demo](https://github.com/AgentVisa/agentvisa-customer-support-demo) 目前,它在底层使用 JWT。但产品不是令牌,而是用于委派权限的简单、安全的工作流程。这是我自己的项目所需要的模式,我希望它对你也有用。 我知道这里存在一个“双面问题”——当智能体连接的服务器也可以验证智能体的真实性时,它最有用。目前,它非常适合保护你自己的内部服务,这也是我的起点。我希望随着时间的推移,这可以被构建成一个更多服务采用的标准。 我很乐意收到与 AI 智能体一起工作的开发者的反馈。 你是否也认同智能体身份和可审计性的问题? “签证 vs. 护照”的概念是否清晰? 你希望在“智能体地图集”上看到什么? Python SDK 是开源的,在 GitHub 上,并且有一个慷慨的免费套餐,你可以立即使用它进行构建。我会尽我所能回答你提出的任何问题。感谢你的关注! SDK:[https://github.com/AgentVisa/agentvisa-python](https://github.com/AgentVisa/agentvisa-python) 演示:[https://github.com/AgentVisa/agentvisa-customer-support-demo](https://github.com/AgentVisa/agentvisa-customer-support-demo) 注意:对于我们这些在南半球的人来说,现在已经很晚了!所以,如果我睡觉时错过了你的评论,我会在澳大利亚东部标准时间早上第一时间回复。
2作者: Wdorf9 个月前
大家好,HN 用户们,欢迎参加我们 2025 年的第二场活动。<p>这是一个 Hacker News 读者们可以一起讨论技术、科学和商业的场所。<p>地点:The Masque Haunt (Wetherspoon),英国伦敦老街 168-172 号<p>时间:8 月 26 日(周二)下午 6 点 - 9 点<p>Meetup(目前有 64 位参与者):<a href="https:&#x2F;&#x2F;www.meetup.com&#x2F;hackernewslondon&#x2F;events&#x2F;310296581" rel="nofollow">https:&#x2F;&#x2F;www.meetup.com&#x2F;hackernewslondon&#x2F;events&#x2F;310296581</a><p>lu.ma(新):<a href="https:&#x2F;&#x2F;lu.ma&#x2F;xb70gefx" rel="nofollow">https:&#x2F;&#x2F;lu.ma&#x2F;xb70gefx</a><p>这是一个由 Hacker News 读者为 Hacker News 读者组织的非官方社区活动。