21 分•作者: xena•4 天前
返回首页
最新
1 分•作者: akashwadhwani35•4 天前
1 分•作者: mvkel•4 天前
我正在打造 Attagram:一个放在厨房里、每天为孩子们打印报纸摘要的小型打印机。
这个想法源于我一直注意到的一个新兴家庭动态。我的女儿们(A,9岁,J,8岁)越来越独立,但作为父母,我们的大脑和手机里储存着大量无形的信息:项目截止日期是哪天,谁需要球鞋,午餐吃什么,哪个孩子有图书日,屏幕时间前需要完成哪些家务,离露营还有几天,奶奶想让她们知道什么,放学后有什么变化等等。
孩子们生活在这个系统的下游,他们的体验就是一遍又一遍的唠叨:
“去刷牙。”
“收拾好你的文件夹。”
“别忘了你的球鞋。”
“别忘了你的水壶。”
“你收拾好球鞋了吗?”
“请收拾好你的球鞋。”
即使语气温和,重复也会让人觉得像是在唠叨。而且所有信息都困在屏幕里,如果你想限制孩子的屏幕时间,同时又想让他们在这个过程中承担更多责任,这并不是好事。
Attagram 试图解决这个问题。它将这种无形的状态转化为孩子可以拥有的、每天的小纸质物品。
每天早上,打印机会启动,打印一份由父母精心策划的早报。报纸包含“今日计划”、“待办事项清单”、“活动倒计时”、“笑话”、“谜语”、“来自祖父母的便条”等栏目,还有更多内容。孩子们可以撕下来,钉在公告板上,塞进口袋,或者插在钉子上。
这一切都通过一个应用程序来管理。但是!这个应用程序是给父母用的。它的任务是成为世界上最好的工具,将家庭的后勤、仪式和关爱转化为一种无屏幕的纸质体验。报纸仍然是主角,也是孩子体验 Attagram 的方式。
从技术上讲,Attagram 非常简单。它使用现成的零件连接到云服务,以便在预定的时间生成和打印每日摘要。它还允许受信任的家庭成员在需要时发送一次性便条。其魔力在于整体体验以及手中握着纸张的感觉。
这是我的第一个硬件项目,作为一个软件从业者,我非常欣赏(并尊重)需要学习的东西之多。确保产品在第一天就完美无瑕需要付出很多努力,因为硬件更新并不容易。软件就灵活多了!
我们目前正在全国范围内进行家庭私密测试,反馈非常积极。不止一个家庭告诉我,他们的孩子每天早上都会守在打印机前,等着它在预定时间打印。我计划免费提供更多设备,以确保在更大规模生产前收集到所有可用的意见。如果您有兴趣,请发送邮件至 myke@halfcorp.co。
我们初步的计划是在扩大生产规模前,达到 100 个付费预订,部分原因是为了测试陌生人是否真的足够想要这个产品,而不是仅仅说“这个想法很可爱”。[https://www.attagram.com/order](https://www.attagram.com/order)
我希望听取 HN(Hacker News)的经验:
1. 工业设计:在当前迭代中,有什么地方显得“设计糟糕”?另外,如果您对此感兴趣并愿意合作,我很乐意与您交流!
2. 机械工程:有哪些最佳方法可以“加固”此类设备,使其可靠且易于制造?另外,如果您对此感兴趣并愿意合作,我很乐意与您交流!
3. 制造:何时与中国的合同制造商合作?您会尽量避免什么?另外,如果您对此感兴趣并愿意合作,我很乐意与您交流!
4. HN 上的父母们:您会考虑购买这个产品吗,还是觉得它只是个可爱的想法?如果是前者,但您不会预订,为什么呢?
1 分•作者: MehrdadKhnzd•4 天前
1 分•作者: ashleynewman•4 天前
1 分•作者: gmargari•4 天前
1 分•作者: mr_gl00m•4 天前
1 分•作者: easonxia•4 天前
3 分•作者: _____k•4 天前
1 分•作者: modulusme•4 天前
1 分•作者: infodatamatrix•4 天前
1 分•作者: walrus01•4 天前
1 分•作者: skidrow•4 天前
1 分•作者: skidrow•4 天前
1 分•作者: fredski42•4 天前
2 分•作者: IndustryLens•4 天前
1 分•作者: longtermop•4 天前
我所看到的每一个智能体系统都存在同样的隐性成本:模型会反复阅读相同的上下文。
工单、Slack 消息、文档、客户历史记录、数据库笔记、操作手册、日志、过往决策。你可以缓存静态前缀,路由到更便宜的模型,或者设置团队预算,但这些都无法解决根本问题:智能体在开始大多数任务时都会试图重新探索一切。
我们构建 Parcle 作为 AI 智能体的共享记忆层。它会摄取操作上下文,索引已发生的事情,并允许智能体为下一步检索一小部分相关的记忆,而不是将所有内容粘贴回提示中——或者更糟的是,让智能体自行探索并消耗 token。
我们开始跟踪在有和没有我们记忆层的情况下,仅通过索引本地文件来完成任务时消耗的 token。在我们的部署/评估中,我们看到最大的 token 消耗减少高达 70%,任务完成速度大约提高 2 倍。中位数 token 消耗减少约 30%。最大的节省通常来自数据和上下文密集型工作流程;当智能体需要从多个位置和来源检索数据和上下文时。到目前为止,最好的应用场景是支持、运营、研究、销售和财务工作流程,在这些场景中,智能体否则会一遍又一遍地重新加载相同的账户/工作流程/历史上下文。
为什么我认为这现在很重要:
Pylon 的 AI 成本帖子促使我们思考:
由于智能体不断寻找相同的上下文,公司付出了多少成本?这是一种记忆可以解决的隐性成本吗?
我们构建 Parcle 是为了让智能体能够记住。令人惊讶的是,记忆不仅让智能体更有用。它还减少了消耗的 token。用于弄清楚事物位置的 token 更少,用于实际生产性工作的时间更多。
- Anthropic 表示,智能体消耗的 token 是聊天的 4 倍。我们认为这低估了。
- OpenAI 和 Anthropic 都拥有提示缓存,因为重复的提示上下文成本很高,但缓存主要在可重用内容足够稳定以命中缓存时才有效。但这并没有解决提示缓存会在 5-15 分钟不活动后失效的事实。
- “Lost in the Middle” 和 Chroma 的 “context rot” 工作都指向同一个问题:更多的上下文并不等于可用的记忆。
- 上下文工程领域似乎正在趋同于这一点:最困难的部分是决定模型在每个步骤应该看到什么。
Parcle 是我们尝试将此付诸实践的尝试:模型外部的记忆,仅在有用时才选择到上下文中。
我很想听听那些在生产环境中运行真实智能体的人的反馈:
1. 你的 token 实际花在了哪里:重复的输入上下文、工具跟踪、重试、输出、评估,还是其他方面?
2. 提示缓存和模型路由是否足够了?
3. 你需要什么才能信任智能体循环中的外部记忆层?
1 分•作者: pietroppeter•4 天前
2 分•作者: soheilpro•4 天前
4 分•作者: ilreb•4 天前