24 分•作者: pykello•8 个月前
返回首页
最新
3 分•作者: roschdal•8 个月前
59 分•作者: nought•8 个月前
<a href="https://x.com/karpathy/status/1976082963382272334" rel="nofollow">https://x.com/karpathy/status/1976082963382272334</a>
3 分•作者: novocayn•8 个月前
1 分•作者: incidentnormal•8 个月前
2 分•作者: usgroup•8 个月前
2 分•作者: layer8•8 个月前
1 分•作者: petethomas•8 个月前
1 分•作者: gavide•8 个月前
1 分•作者: PranaFlux•8 个月前
1 分•作者: insane_dreamer•8 个月前
在某个新闻简报[1]上看到了这张图表[0],我感到非常惊讶:美国的调查回复率低于70%,而2013年时超过90%。我认为这是“技术进步”以及如今沟通便利性带来的一个有趣且负面的副作用。我们被各种信息淹没,只想屏蔽一切。更不用说无休止的垃圾电话(我从不接听不在我联系人列表里的号码,所以调查员根本联系不上我。)
这是一个严重的问题,因为如果调查回复率低,就会增加数据的误差范围,也意味着政府听取民众意见的机会变少了。
有一篇论文[2]探讨了(部分)造成这种情况的原因。
根据这个[3],英国也面临着同样的问题。
人工智能只会让情况变得更糟,因为它可以轻松地在无人干预的情况下拨打垃圾电话。
2 分•作者: JumpCrisscross•8 个月前
1 分•作者: LordAtlas•8 个月前
1 分•作者: landl0rd•8 个月前
7 分•作者: jandeboevrie•8 个月前
2 分•作者: arnaudbd•8 个月前
大家好,HN!我一直在开发一个工具,它将文件管理器、白板、书签、笔记和简单的图形设计整合到一个轻量级的界面中。
这个想法是让所有这些工具感觉像一个流畅的空间,而不是 5 个独立的工具。希望能够复制实体桌面的感觉:秩序与自由并存。
这个 15 分钟的视频介绍了当前的 Alpha 版本以及完整产品的愿景:<a href="https://youtu.be/AcWzuBBuiPM" rel="nofollow">https://youtu.be/AcWzuBBuiPM</a>
我很乐意听取您的反馈——尤其是在概念和用户体验方面。如果您想试用,Alpha 版本已上线:<a href="https://gyst.fr" rel="nofollow">https://gyst.fr</a>
目前这是一个个人项目,灵感来自于“第二大脑”/个人知识管理(PKM)运动,以及我个人对工具碎片化和过时用户体验的沮丧。
13 分•作者: kbyatnal•8 个月前
嘿,HN!我们是Kushal和Eli,Extend(<https://www.extend.ai/>)的联合创始人。Extend是一个面向AI团队的工具包,用于处理各种混乱的文档(例如PDF、图像、Excel文件),并构建出色的产品。
我们构建Extend是为了处理那些会让大多数流程崩溃的最难处理的文档。你可以在我们的演示中看到一些例子(无需注册):<https://dashboard.extend.ai/demo>
我知道你可能在想“又一个文档API创业公司”。不幸的是,这个问题还没有得到解决!
我个人曾在之前的工作中花费数月时间努力构建可靠的文档处理流程。边缘情况的“长尾”是无止境的——跨页的大表格、100多页的文件、潦草的笔迹、潦草的签名、以10种不同格式表示的复选框、多种文件类型……这个列表还在不断增加。在YC期间,我们看到无数其他团队也遇到了同样的问题,于是我们开始构建Extend。
我们最初推出了一套API,供工程师用于解析、分类、拆分和提取文档。这开始起作用,很快我们就在构建医疗代理、实时银行账户开户、抵押贷款自动化等产品的公司中投入生产。随着时间的推移,我们与这些团队紧密合作,亲眼目睹了原始OCR/模型输出与生产就绪的流程之间有多大的差距(LLM和VLM并非万能)。
与该领域的其他解决方案不同,我们特别关注三个核心领域:(1)计算机视觉层,(2)LLM上下文工程,以及(3)相关的产品工具。我们认为,这三者的结合才能达到99%的准确率并保持其规模。
例如,为了解析潦草的笔迹,我们构建了一个基于智能体的OCR校正层,该层使用VLM来审查和编辑低置信度的OCR错误。为了处理多页表格数据,我们构建了一个语义分块引擎,该引擎可以检测文档内的最佳边界,以便模型在较小的上下文输入下表现出色。
我们还发布了一个提示优化智能体,以自动化团队花费在无休止的提示工程上的时间。它被构建为一个后台智能体,以复制你团队中最好的提示工程师,并在循环中运行,可以访问一组工具(查看文件、运行评估、分析结果和更新模式)。
整个过程中最令人惊讶的部分是看到了有多少疯狂的PDF格式!我们遇到过各种各样的文档,从超市库存杂志、农药标签、建筑蓝图到卫星制造计划。
上面描述的所有内容今天都已上线。你可以在这里看到它的实际应用(无需注册):<https://dashboard.extend.ai/demo>。要上传你自己的文件,你可以登录并进行操作(我们今天为所有注册的帐户添加了免费的使用额度)。
我们很高兴与HN分享!我们很乐意听取你构建文档处理流程的经验。请试用一下,并与我们分享任何和所有反馈(例如,无法处理的困难文档、功能请求)。
89 分•作者: meetpateltech•8 个月前
29 分•作者: divbzero•8 个月前
21 分•作者: ryandotsmith•8 个月前