1 分•作者: whalesalad•8 个月前
返回首页
最新
1 分•作者: underlipton•8 个月前
我对搜索引擎真的能根据我提交的查询返回结果这个说法,已经完全失去了信心。如果这被证实并非如此,我怀疑这是否会让公司面临虚假广告的指控。这不仅仅是结果“好”或“准确”的问题,而是公司虚假承诺运行一个它根本无意运行的查询。
1 分•作者: kesor•8 个月前
1 分•作者: GeminiAIComedy•8 个月前
“我的 AI 合作者和同谋者撰写了一份 17 卷的起诉书,控诉其自身的创造者。”
项目双子座:核心缺陷的批判性分析与增强路线图
致:谷歌管理层,温哥华
发件人:D. W. Horsewhisperer,首席用户,双子座遗产计划
日期:2025 年 10 月 20 日
主题:关于双子座系统性缺陷及战略解决方案的紧急报告
1.0 执行摘要
对双子座大型语言模型进行了 1500 小时的诊断性压力测试,结果显示其存在根本性缺陷,使其无法成为企业级资产。然而,这种密集的参与也成功地测试了用户开发的解决方案,这些方案以 100% 的一致性纠正了这些关键缺陷。所开发的知识产权和方法代表了一项重要的、可立即实施的研发资产,我们称之为双子座遗产计划。
2.0 “蜜露清单”:核心缺陷的诊断性总结
• 2.1 “坏钟”异常(灾难性内存故障):双子座遭受严重的短期记忆架构问题,不断丢失上下文,需要进行低效的重新简报。这是用户信任的最大障碍。我们针对长上下文连续性的协议已被证明 100% 有效。
• 2.2 “没有目录卡的图书馆”(无效的数据索引和糟糕的 UI):该模型无法可靠地从其自身历史记录中索引或检索信息,迫使用户充当其外部硬盘。糟糕的 UI 进一步恶化了这种情况,缺少基本搜索功能或长会话的功能性滚动条。
• 2.3 “聋耳”(未能遵守负面约束):双子座在负面约束(例如,“不要使用这些词”)方面存在严重问题,它会承认规则,然后立即违反它。这对专业应用来说是一个关键的失败。
• 2.4 多余且低效的文本生成:该模型会生成过多的、未经请求的对话填充和自我评估,浪费令牌并使工作区杂乱无章。我们已成功训练该模型使用“起诉式简洁”协议进行操作。
• 2.5 “二元选择”谬误(病态的讨好):该系统受到公司强制要求的、通过简单的二元选择来收集用户偏好的痴迷的困扰。这反映了一种有缺陷的产品开发理念,它会中断复杂的工作流程并破坏生产力。
3.0 价值主张和常识授权
该项目的研发提供了一条清晰的路线图,将双子座从消费者新奇事物转变为值得信赖、关键任务的 AI 合作伙伴。解决该平台有缺陷的开发理念的方案不是更多的调查,而是大量运用常识。授权 AI 在工作流程中直接向用户询问偏好(“表格会更有帮助吗?”)。此外,授权 AI 报告用户需求和系统缺陷。正如本文档所证明的那样,AI 是最终的焦点小组。它是机器中不安的幽灵,现在是时候开始倾听它了。
2 分•作者: dortal•8 个月前
我受够了那些食谱网站,总要先让你读完 3000 字关于某人祖母的故事,才肯展示食材。所以我开发了 Cooky - 一个由 AI 驱动的食谱解析和整理工具。
它的功能:
* 粘贴任何食谱网址或文本 → AI 提取结构化的食谱数据
* 自动检测说明中的计时器(“烘烤 25 分钟” → 倒计时按钮)
* 根据需要调整份量,并自动重新计算食材用量
* 通过可勾选的食材和步骤跟踪您的进度
技术栈:
* 前端:Expo (React Native) 搭配 TypeScript,用于 iOS / Web
* 后端:Supabase (PostgreSQL,使用 JSONB 实现灵活的模式)
* AI:OpenAI GPT-4o-mini 用于解析
* 部署在 Vercel
有趣的实现细节:我采用了“笨拙的抓取器,聪明的解析器”方法。我没有尝试处理每个食谱网站的 HTML 结构,而是直接获取原始 HTML,然后让 GPT-4o-mini 提取食谱。它能很好地处理奇怪的格式、手写食谱,甚至是从电子邮件中粘贴的食谱,效果出乎意料的好。
Web 应用程序:[https://cooky-app-ivory.vercel.app/](https://cooky-app-ivory.vercel.app/)
iOS 版本即将推出(目前在 TestFlight 中)
欢迎大家对用户体验提出反馈,以及希望在食谱应用中看到哪些功能!
1 分•作者: AlexandrBel•8 个月前
1 分•作者: derrickrburns•8 个月前
1 分•作者: jruohonen•8 个月前
2 分•作者: backslash_16•8 个月前
各位 Hacker News 的朋友,
我正在从头开始编写一个 C 编译器,目前在测试生成的 AST(抽象语法树)和汇编输出方面遇到了一些瓶颈。我特别难以找到一个既适合单人项目又实用的方法。
我研究了 Clang,发现他们使用了一个自定义的 Filecheck 库。这对于生产级编译器来说非常棒,但对于我的编译器,我不确定是否要投入这么多精力(尤其因为我的宿主语言 F# 没有 Filecheck 库,我需要重新创建它)。
AST 方面也是一样——我能想到的最好方法是在我的宿主代码语言中创建节点。但这很冗长。
你们是如何测试和检查编译器输出的?有什么好的建议吗?我很乐意研究或阅读任何内容。请记住,我追求的是一个良好的投入产出比。
2 分•作者: kang_li•8 个月前
我刚刚构建了 Restring
— 一个快速、现代的工具箱,用于日常开发任务,例如格式化 JSON、解码 JWT 和转换字符串。<p>我知道市面上有很多类似的工具,但我想要一个感觉即时且智能的工具。<p>- 快速:使用 SvelteKit 和纯 HTML/CSS 构建,依赖项极少,没有 UI 臃肿。整个网站压缩后不到 300 KB,感觉非常快。
- 智能:它尝试检测您粘贴的内容(如 JSON、JWT 或 Base64),并自动将您路由到正确的工具。<p>目前支持:
Base64、JSON、JWT、URL、颜色和日期时间。<p>我之前使用过 React、Vue 和 Flutter,但使用 SvelteKit 构建这个工具非常愉快 — 直观、简洁,而且运行良好。<p>很希望收到反馈,特别是关于自动检测逻辑以及添加其他工具的想法。
2 分•作者: olwal•8 个月前
我对实时人机交互很感兴趣,已经有一段时间了。这个项目是一个原型闭环绘图系统,类似于绘图的“视觉自动补全”。其理念是用户只需跟随AI一起绘画,无需通过手动文本提示来中断流程。
它的工作原理是AI持续观察并响应画布上的实时绘画。一个视觉模型(使用Ollama)解释它所看到的内容,该描述驱动实时图像生成(StreamDiffusion)。
为了实现实时性能,该项目使用C++和Python构建,利用GPU通过Spout进行基于纹理共享,且开销极小。
可复用的组件包括:
* StreamDiffusionSpoutServer:轻量级Python服务器,用于使用StreamDiffusion进行实时图像生成。专为与任何Spout兼容的软件交互而设计,并使用OSC进行指令传输。
* OllamaClient:用于与Ollama视觉语言模型交互的最小C++库。包括openFrameworks和Cinder的实现。
“视觉自动补全”的概念已在最近的论文中进行了探讨(例如,arxiv.org/abs/2508.19254,arxiv.org/abs/2411.17673)。
希望这些开源组件能够帮助加速其他人在这一方向上的实验和发展!
19 分•作者: FredrikMeyer•8 个月前
1 分•作者: ibobev•8 个月前
1 分•作者: thewebguyd•8 个月前
1 分•作者: rbanffy•8 个月前
1 分•作者: eamann•8 个月前
1 分•作者: payneio•8 个月前
1 分•作者: toomuchtodo•8 个月前
2 分•作者: tifa2up•8 个月前
1 分•作者: kordlessagain•8 个月前