返回首页

一周热榜

26作者: xlayn3 天前
我复现了 David Ng 的 RYS 方法(<a href="https:&#x2F;&#x2F;dnhkng.github.io&#x2F;posts&#x2F;rys&#x2F;" rel="nofollow">https:&#x2F;&#x2F;dnhkng.github.io&#x2F;posts&#x2F;rys&#x2F;</a>),并在消费级 AMD GPU(RX 7900 XT + RX 6950 XT)上进行了测试,结果出乎意料。<p>Transformer 似乎拥有离散的“推理电路”——由 3-4 层组成的连续区块,它们充当不可分割的认知单元。复制正确的区块,模型就会运行两次推理流程。无需更改权重,无需训练。模型只是思考得更久了。<p>在标准基准测试(lm-evaluation-harness,n=50)上的结果如下:<p>Devstral-24B,复制 12-14 层一次: - BBH 逻辑推理:0.22 → 0.76 - GSM8K(严格):0.48 → 0.64 - MBPP(代码生成):0.72 → 0.78 - 没有任何指标下降<p>Qwen2.5-Coder-32B,复制 7-9 层一次: - 推理探针:76% → 94%<p>奇怪的是:不同的复制模式可以从相同的权重中创建不同的认知“模式”。双流程提升数学能力。三流程提升情感推理能力。交错加倍(13,13,14,14,15,15,16)则创造了一个纯粹的数学专家。相同的模型,相同的 VRAM,不同的路由。<p>电路边界非常清晰——移动一层,效果就会消失或反转。较小的模型(24B)比大型模型(Ng 在 72B 中发现了 7 层)拥有更紧凑的电路(3 层)。<p>在代码库中提供了用于在任何 GGUF 模型中查找电路并应用任意层路由的工具。整个过程——扫描、发现、验证——只花了一个晚上。<p>欢迎提问。
25作者: bblcla3 天前
大家好,如果你有幸在配备了 Starlink 的航班上体验过,你就会明白它的魅力。它真的好用! 然而,在航班上使用 Starlink 的情况并不稳定,也很难预测。因此,我们建立了一个数据库,收录了所有已经推出 Starlink(不仅仅是试用)的航空公司,并开发了一个航班搜索工具来预测。输入航班号和日期,我们就可以根据飞机类型和尾号来估算航班上配备 Starlink 的可能性。 如果你近期没有出行计划,也可以查询特定航线,看看哪些航班提供 Starlink 服务。你可以在这里找到它:<a href="https://stardrift.ai/starlink">https://stardrift.ai/starlink</a>。 我想补充几点关于这个工具的工作原理。在回答查询时,我们会按顺序检查三件事: * 这家航空公司是否配备了 Starlink? * 这架飞机机型是否配备了 Starlink? * 这架飞机是否配备了 Starlink? 目前只有少数几家航空公司配备了 Starlink:联合航空、夏威夷航空、阿拉斯加航空、法国航空、卡塔尔航空、JSX 以及其他少数几家。因此,如果飞机由其他任何航空公司运营,我们可以立即给出否定的答案。 然后,我们会检查飞机实际的机型。航空公司通常会提前公布设备分配情况,而且他们也在逐个机型地推出 Starlink。例如,我们知道所有 JSX 的 E145 飞机都配备了 Starlink,而法国航空的 A320 飞机都没有配备 Starlink。(你可以在这里查看我们的数据摘要:<a href="https://stardrift.ai/starlink/fleet-summary">https://stardrift.ai/starlink/fleet-summary</a>,尽管实际的逻辑包含一些未在此处编码的规则。) 如果机型完全匹配,我们可以有把握地告诉你你的航班将配备 Starlink。然而,在大多数情况下,航空公司只是对该机型进行了部分升级。在这种情况下,我们需要深入研究,弄清楚究竟是哪架飞机在你的航线上飞行。 我们可以通过查找“尾号”(可以把它理解为飞机的车牌号)来实现这一点。不幸的是,尾号通常只有在航班起飞前几天才会分配。因此,在此之前,我们能做的最好的事情就是计算你的飞机被分配到已启用 Starlink 的飞机的概率。 为此,我们不得不建立一个飞机尾号与 Starlink 状态的映射。在这里,我要感谢维护着详细的电子表格和论坛帖子的在线航空爱好者们,他们跟踪着这些数据!据我所知,他们通常从热衷于 Starlink 推广的航空公司工作人员那里获得这些数据,因此这是一个可靠且经常更新的来源。我们的大部分工作是找到每个来源,规范它们的格式,构建一个可靠且负责任的系统来提取它们,然后将它们与其他数据源连接起来。 基本上,这是一个数据规范化问题!我过去从事金融数据系统工作,我对这个问题与金融数据问题如此相似感到惊讶。 Starlink 本身也是一项非常酷的技术。我还写了一篇博文(<a href="https://stardrift.ai/blog/why-is-starlink-so-good">https://stardrift.ai/blog/why-is-starlink-so-good</a>),讲述了它为什么比其他所有飞机 Wi-Fi 选项好得多。从宏观上讲,这只有在如今火箭发射如此便宜的情况下才有可能实现,这非常酷。 它的性能很棒,所以如果可能的话,值得你根据它来规划你的航班。目前,在美国,你的最佳选择是联合航空的支线航班和 JSX/夏威夷航空。在国际上,卡塔尔航空是最佳选择(尽管目前显然不行),法国航空位居第二。但随着越来越多的航空公司在今年推出这项服务,这种情况将会发生变化,我们将不断更新我们的数据库!