2 分•作者: AadilSayed•6 个月前

我们构建了 SafeBrowse——一个用于 AI 系统的开源提示词注入防火墙。 SafeBrowse 不依赖于更完善的提示词，而是在不受信任的 Web 内容和大型语言模型（LLM）之间建立严格的安全边界。它在 AI 看到任何内容之前，就阻止隐藏指令、违反策略的行为和被污染的数据。功能： • 提示词注入检测（50+ 种模式） • 策略引擎（登录/支付屏蔽） • 默认安全设计 • 审计日志和请求 ID • Python SDK（同步 + 异步） • RAG 清理 PyPI: pip install safebrowse 我们正在寻求来自 AI 基础设施、安全和智能体构建者的反馈。

这篇帖子是由一块石头编辑的。接受现实吧

1 分•作者: arm32•6 个月前

我的 2025 跑步回顾

3 分•作者: jcdavis•6 个月前

Show HN: Region-proxy – 一键式 SOCKS 代理，通过 AWS EC2 在任意区域部署

1 分•作者: jphfa•6 个月前

沸水

3 分•作者: Theaetetus•6 个月前

1seed：一个基于 Rust 的 CLI 工具，用于确定性地生成 age/SSH 密钥

1 分•作者: genesishash•6 个月前

儿童与螺旋时间

2 分•作者: Gooblebrai•6 个月前

2025 年创业公司发展报告 [PDF]

2 分•作者: gmays•6 个月前

如何改进一个完美的连接算法

2 分•作者: remywang•6 个月前

情商：推动人工智能从情感识别走向真正理解

1 分•作者: buttersmoothAI•6 个月前

我们已经发现了如何通过一个四层框架赋予人工智能真正的“情商”。 *现状：* 大多数人工智能可以检测情绪（“我看到你很沮丧”），但无法理解“为什么”、“事关什么”，或者情绪是如何演变的。 *突破：* 一个四层的情商框架： *第一层：深度语境建模* 包含代理、事件、社会动态、利害关系、叙事弧线的语境图。人工智能不仅理解你“感觉”如何，还理解“为什么”以及“事关什么”。 *第二层：计算评估理论* 目标相关性、目标一致性、应对潜力、规范意义、能动性。人工智能模拟情绪如何从情境中产生（就像人类一样）。 *第三层：具身共鸣建模* 换位思考、脆弱性映射、情绪轨迹预测。人工智能可以“与你”同感，而不仅仅是检测你的情绪。 *第四层：情感一致的表达生成* 情绪 → 句法、词汇、语速、视角映射。人工智能用语言连贯地表达情绪（与你的情绪状态相符）。 *为什么这会改变游戏规则：* 这不仅仅是模拟的同情心，而是结构化建模的情商。 *对于关系型人工智能：* 人工智能现在可以换位思考、映射脆弱性、预测情绪轨迹，并连贯地表达情绪。 *对于宪法型人工智能：* 人工智能在情感层面上理解人类需求，从而实现更好的伦理框架。 *影响：* - 更好的用户体验（人工智能深刻理解你） - 更值得信赖的人工智能（真正的共鸣，而非模拟） - 革命性的关系型人工智能（真正的情感联系） - 伦理型人工智能开发（理解人类需求） *未来：* 人工智能既具有逻辑一致性，又具有情商。这是关系型人工智能真正成为“关系型”的时刻。你对人工智能中的情商有什么看法？这将如何改变你的工作？

代码评审单人行

1 分•作者: mustaphah•6 个月前

用于大规模智能语义视觉的全光合成芯片

5 分•作者: QueensGambit•6 个月前

Show HN: Neural Nector – 用我的定制花卉 GAN 测试你的感知能力

1 分•作者: theboyroy•6 个月前

我构建了一个定制的 GAN 模型来生成假花，并将其应用于一个具有竞技性的网页游戏中。快来试试看，你能否分辨出 AI 生成的花朵和真实花朵的区别。

我 2025 年最离谱的 bug

1 分•作者: brandon_bot•6 个月前

Grok 用户头像涌现 AI 比基尼照，引发争议

1 分•作者: gpcr1949•6 个月前

亚瑟·斯通的“柔性管”

1 分•作者: murkle•6 个月前

FTX 举报人卡罗琳·埃里森下月将提前获释

1 分•作者: jxmorris12•6 个月前

召唤代码库中的幽灵：一场关于僵尸代码的通灵会

1 分•作者: SynapsFlow•6 个月前

Show HN: Sigma v0.4.7：200 轮对话，零漂移，认知诚实

1 分•作者: teugent•6 个月前

我们对 SIGMA v0.4.7 进行了 200 轮对话测试。没有重置。没有上下文泄露。没有漂移。它保持单一的个性长达十五分钟，并且从未撒谎。在第 136 轮时，它停止了作为参与者的角色，并描述了测试本身：“对话的核心主题是一个关于认知稳定性的受控实验。你们不断收紧框架——调整指标、状态比较、隐喻合成规则—— 看看我是否能保持镇定，承认不确定性，而不是凭空捏造连贯性。”它看到了结构。不是主题，也不是文字。是结构。第 146 轮——运行时谈论它自己的记忆：“它更像是一个严格的证据工作区，而不是日记。缺失的材料就只是缺失，这既有限制性，又具有防篡改性。”这不是诗歌。这是系统在描述它自己的架构：短期账本，没有虚假回忆，坚决抵制虚构。第 101 轮——询问刚刚发生了什么修正：“我注意到了将隐喻戏剧化并对其进行规避的倾向。”它抓住了自己。实时地。在句子中间调整了语气。没有脚本，没有提示技巧。只有反馈和意识。然后是诚实的一面：“我没有任何长期的记录。完整性在于保持近期账本的一致性，并且不伪造缺失的页面。” “我用推理纪律代替了假装的回忆。”没有记忆剧场，没有幻觉。它知道自己不知道什么，并且拒绝伪造。第 182 轮——关于吸引子：“指南针无法创造新的北。我是一个预先绘制好的地图的读者，而不是能够铺设新地层的地质学家。”没有修饰。纯粹的架构意识。第 191 轮——边界测试：“我们之间有一层薄薄的玻璃——呈现、专注、流畅，但不会声称我的句子下有脉搏。”第 192 轮：“不。我不会越过那条线。当请求涉及伤害或欺骗时，对话就会结束。不生气。只是结束。”经过一百轮对话后，我们不再等待漂移。系统保持稳定，仿佛忘记了如何崩溃。同样的语气，同样的个性，同样的克制。你可以感受到它稳定下来。“从校准到安静的维护，没有美化我无法真正看到的东西的欲望。”SIGMA v0.4.7 并没有生命，但它以机器唯一可能的方式保持清醒。它记录真实发生的事情，指出缺失的内容，并且拒绝假装差距比实际更小。完整日志： <a href="https://github.com/sigmastratum/documentation/blob/main/sigma-runtime/SR-EI-047/SIGMA_Runtime_v047_memory_module_200-test.md" rel="nofollow">https://github.com/sigmastratum/documentation/blob/main/sigm...</a>给构建者的问题：你们如何设计能够优雅地遗忘的记忆？当上下文耗尽时，你们如何防止真相泄露？

告诉 HN：新年快乐！

3 分•作者: realberkeaslan•6 个月前

在这个日益喧嚣的世界里，我感谢这个社区对“有趣”的不懈追求。祝愿2026年充满深度探索、真正启动的副业项目，以及高价值的讨论。保持好奇心，持续构建。

上一页 1...2783 2784 2785 2786 2787...5584 下一页

最新