2作者: stevesolun6 天前
您好 HN! Token 成本已成为我们共同关注的热点问题。我尝试过一些(非常棒的)工具,例如 rtk、caveman 和最近(虽然搞笑但有效)的 ponytail。它们通常的做法是在线 token 缩减,例如尽可能压缩请求/响应。 但随后我想到(我相信其他人也有类似的想法)——就像我们有路由器来选择合适的模型一样,为什么不能有一个工具,根据仓库/上下文来缩小可用工具、技能和 MCP 的范围呢? 人们通常会积累技能、代理、MCP 服务器、harnesses、提示词、仓库说明和本地脚本。我并不是说我们都是囤积者,但我们确实有点像。你最近一次删除技能是什么时候?一段时间后,模型会有太多选项可供选择。 ctx 试图在会话变得臃肿之前选择上下文来解决这个问题。所以,它不会清理你杂乱的车库,但它会给你一副魔法眼镜,让你只专注于你需要的工具。 它是如何做到的?它通过观察仓库和任务,遍历可用工具的图谱,并推荐一小部分得分最高的技能、代理、MCP 服务器和 harnesses 组合。 它是如何知道的?为了确保结果不被幻觉化且可重复,我精心整理了一个包含 91k+ 技能、467 个代理、10.7k 个 MCP 服务器、207 个 harnesses 的列表,并构建了一个图谱来帮助 ctx 做出推荐决策。虽然我当然是利用 AI 来生成它,但我对其进行了精心策划和修订,以确保数据是最新的。 那么,这与 rtk、caveman、ponytail 和类似的 token 节省工具有什么不同呢? 如上所述,这些工具大多是在某个东西已经被使用后才进行 token 缩减。 * rtk 压缩命令输出。 * caveman 风格的工具让助手用更少的词语来回应。 * ponytail,嗯,非常棒,但它更侧重于减少代码(YAGNI)。 ctx 是上游的。它试图完全避免将不相关的技能、代理、MCP 和 harnesses 加载到上下文中。 所以它并不是真正的替代品。它应该与它们协同工作! 使用 ctx 选择正确的工具。 使用 rtk 减少终端输出的噪音。 如果你想要更短的响应,可以使用 terse-output 工具。 目标很简单:在不迫使用户手动测试和比较数千种可能的技能、代理、MCP 服务器和 harnesses 的情况下节省 token。 仓库:https://github.com/stevesolun/ctx
1作者: jhylands6 天前
我花了一段时间来尝试设计一款能够产生程序生成游戏般的涌现效果,但又只需要纸和笔就能玩的游戏。在这里,我将呈现我能想到的最简洁且具有涌现性的版本。我非常享受能够玩这类游戏,同时又不会感觉大脑在退化。我猜我的计算能力在玩这个游戏的过程中得到了提升。
2作者: otekengineering6 天前
HN 确实很棒,尤其和 Reddit 相比(除非我错过了最好的子版块?),但即使在这里,也有一些人,他们自己根本不会骑自行车,却滔滔不绝地谈论自行车多么没用/危险等等,还告诉我不要忘记跑步的重要性。有没有一个专门为自行车爱好者准备的论坛? 毫无疑问,很多优秀的工具和框架都藏在自托管的 Git 仓库里,我就是想和这群人交流。 我希望在一个社交网络上能找到的、可以“近距离观察”的视角类型示例: https://www.thoughtfultechnologist.com https://simonwillison.net
5作者: smalltorch6 天前
您好,我创建了 nanogram,一个以隐私为中心的社交媒体平台,旨在让用户完全掌控自己的数据。 nanogram 使用纯粹的开源替代方案,提供了一种强大而简洁的方式来模拟 Instagram 早期的体验,让朋友们可以分享彼此的瞬间,而无需任何冗余内容。 此外,还提供了与朋友玩拼字游戏、四子棋和国际象棋的功能。 该平台采用邀请制,这意味着服务器运营商必须生成邀请令牌才能允许新用户加入。 由于 Tor 的全球强大能力,托管完全免费,并且由于其作为洋葱服务运行,因此支持端到端加密 (E2EE)。 您可以在此处找到它:https://gitlab.com/here_gorawhile/nanogram-pi
2作者: maclinz6 天前
我想戒掉沉迷于负面新闻的习惯,于是我开发了一款微学习应用,它采用了类似抖音的算法,拥有同样的成瘾式信息流机制,但你却能从中真正学到东西。 我最初开发了一个通用版本,Scroll: Daily Microlearning (microlearning.usescroll.app),但很快意识到,当专注于单一主题时,它的效果更好。因此,我将其拆分为: Scroll: Personal Finance (https://finance.usescroll.app) Scroll: Learn AI (https://ai.usescroll.app) Scroll: Daily Microlearning (https://microlearning.usescroll.app)
1作者: waxsway6 天前
在架构之前,有一个具体的输出用于验证。 来自 Bybit/Lazarus 攻击的主要钱包得分 10/100,风险等级高,态势升级,OFAC 拉撒路集团的归属直接显示在简报中。完整判决在此:[https://credscore.us/v/o6wr--NrABo](https://credscore.us/v/o6wr--NrABo) 该引擎是确定性的,评分路径中不使用机器学习。每个信号都有明确的数值权重。结构化模式检测:扇出分布、源-回流、循环资金、重复金额-区间再循环。对于已确认的 OFAC SDN 匹配,硬性制裁上限为 12 分,在管道的三个独立点强制执行。相同的钱包始终产生相同的分数。每个输出都可以追溯到特定的链上活动,并附有书面理由。 支持五个 EVM 链:以太坊、Base、Arbitrum、Optimism、Polygon。评分范围 0-100(分数越高风险越低),决策态势(继续/审查/升级),结构化分析师简报。从地址到判决的分析时间不到 15 秒。 它不做什么:不支持非 EVM 链(比特币、Solana、Tron),不支持大规模实时流监控,不支持通过桥接进行深度跨链追踪。这些是 Chainalysis Reactor 和 TRM Forensics 更擅长的工作。CredScore 是快速的初步评估,而不是深入调查。 如果您想独立验证引擎输出,有两个关于真实攻击者钱包的公开案例研究: Bybit/Lazarus 钱包树:[https://credscore.us/case-studies/bybit-hack-lazarus-wallet-analysis](https://credscore.us/case-studies/bybit-hack-lazarus-wallet-analysis) Drift/DPRK 钱包,仅根据行为标记:[https://credscore.us/case-studies/drift-hack-dprk-wallet-analysis](https://credscore.us/case-studies/drift-hack-dprk-wallet-analysis) 在 [https://credscore.us/desk](https://credscore.us/desk) 免费进行首次分析,无需信用卡。 我目前正在处理的最具挑战性的评分问题是区分合法的、高对手方熵与 drainer 状受害者扇入(在信号层面)。该引擎目前将高对手方熵视为一个轻微的积极信号(更广泛的可观察行为通常是好的)。但对于 drainer 钱包,数百个不同的入站对手方以及小额交易是受害者,而不是合法的对手方多样性。我正在探索对手方价值分布和入站/出站比例作为区分因素,但信号形状与合法的批量支付确实存在重叠。好奇在无法回退到机器学习聚类的情况下,其他人在确定性风险评分系统中是如何处理这种区分的。