3作者: hannasanarion5 个月前
嗨,HN! 在社交媒体上看到多次提到“选举真相联盟”后,我阅读了他们的分析,结果怎么也无法摆脱其中看到的问题。 于是我下载了数据,从头开始重建了他们的完整分析。 他们犯的根本错误是简单地误解了“大数定律”:在大样本中收集的值会收敛于样本分布中的真实概率。 (不要与“极大概率定律”混淆:该定律指出,只要时间足够长,不太可能发生的事情也会发生。这曾经也让我很困惑) 技术细节: * 没有构建系统,完全是手工制作的 HTML、CSS 和纯 JavaScript。 * 初始分析使用 Python 完成,仅使用标准库。 * 可视化使用 Observable Plot 和 D3.js 创建 * 模拟完全在客户端运行 * 网页使用 Scrollama 构建,用于动画和行为控制 * 选票历史可视化实时处理约 60 万条单独的选票记录,并进行少量缓存以防止浏览器卡顿。 * 在 Windsurf 的帮助下完成 有趣的技术挑战: * 在没有后端的情况下使可视化具有高性能,这通过在滚动时进行一些预加载和一些缓存来实现,以便可视化可以尽可能共享资源。 * Windsurf 有时会失控。在初始预处理阶段,它曾经将一个绝对巨大的 JSON blob 转储到磁盘上,它太大了,实际上导致我的整个计算机在写入时崩溃。然后为了读取它,显然不能直接读入,但我的 Opus 4 驱动的编码代理并没有选择以更合理的方式存储,而是决定从头开始构建一个流式 JSON 解析器。它奏效了,我得到了我需要的数据,所以我没有回头让它更合理,但天哪,这太蠢了。 这实际上是从模拟开始的,只花了一天左右的时间,后来扩展到包括重新分析和可视化。可视化是在我获得数据后的 2-3 天内完成的。 如果再让我做一次,我可能会尝试寻找某种构建系统或静态站点生成器来组合最终结果。一旦页面变得很长,即使对于 windsurf 来说,它也变得非常笨拙。很短的对话可能会淹没 Sonnet 4 的速率限制,因为单个文件中包含的内容太多了。
3作者: dudeWithAMood5 个月前
我做了一个开源、货真价实的 YouTube 摘要网站,它使用 tldw [1] Python 库来快速生成 YouTube 视频摘要。 演讲时间越长,创作者获得的广告收入就越多。但我们并非都有 40 分钟的时间来听某人慢慢地绕着一个观点兜圈子。 这个网站没有广告,无需登录,而且 100% 免费。你可以在这里找到源代码 [2]。 [1] <a href="https://pypi.org/project/tldw/" rel="nofollow">https://pypi.org/project/tldw/</a> [2] <a href="https://github.com/DavidZirinsky/tldw-site">https://github.com/DavidZirinsky/tldw-site</a>
2作者: sarahmk1255 个月前
在 Railway(我在这里工作),我们将在 8 月 6 日开始举办黑客松活动。<p>为其他人构建一个模板,无论是用于全栈应用程序还是无头 CMS。<p>我们看到有人部署传统应用程序或基础设施来托管营销博客网站(我们自己的网站也在 Railway 上托管)。<p>根据项目的复杂性或内容的深度,最高可获得 1000 美元的奖金。