1作者: punnerud17 天前
我不断地将前沿模型推向极限,还有几个项目它们仍然无法解决,我会在这些项目上对新模型进行基准测试。每一个新模型都让“解决”更难的问题变得更容易,但我仍然觉得它们 99% 依赖于我的想法。 它们就是无法理解这些想法,我必须手把手地指导它们。 请不要误会我的意思,任何已经接近完成的事情,它们都能做得很好,并且可以结合现有技术。我说的是模型从未见过的新想法。 举个例子,我有一个业余项目,它在路线优化方面不断突破可能性。是的,它已经接近 SOTA(State-of-the-Art),并且比目前 (?) 所有其他解决方案都更有效率 (punnerud.github.io/mpee/),但我必须手把手地指导模型,并一起构思如何压缩矩阵。 而且这并非一次性的事情,在几天内会发生大约 40-50 次。 那 1% 就是这个“新想法”的部分。为什么我能想出所有这些想法,而模型却不能? 这是一个非常难以实现的“重新评估”。现在这个项目是公开的,之后我打算以同样的方式做一个前沿项目,不对公众开放,并将其用作基准测试。这是测试模型新想法的最佳方式吗?
1作者: tosh17 天前
2作者: vedant28t17 天前
各位 HN 的朋友们,我是一名在加州弗里蒙特的高中生。周二早上,我收到了一条全县范围内的 AC Alert 短信,通知阿拉米达县的所有居民为今晚 11 点开始的东湾山脉红色警报准备应急包。这条短信发送给了大约 50 万部手机。 实际的国家气象局(NWS)警报区域仅覆盖东湾山脉(NWS 区域 CAZ515)。大多数收到短信的人今晚并不需要应急包。一些住在山丘地区的人并没有意识到他们离危险有多近。所以我构建了这个工具 - [https://redflag-check.info/](https://redflag-check.info/),这是一个 MIT 许可的公共 GitHub 项目 - [https://github.com/vedant-f-is-ma/redflag-check](https://github.com/vedant-f-is-ma/redflag-check) 它有几个功能:告诉人们他们是否处于警报区域内,还可以让他们检查朋友是否处于警报区域内,并向他们发送短信。所有这些都无需安装应用程序。 我从奥克兰消防安全委员会主任那里得到了反馈,了解了我(以及这个工具)理解上的一个盲点。令我惊讶的是,通过反馈,我意识到不能假设只有警报区域才存在风险。相邻区域也存在风险!火灾不会遵循区域边界!我已经修复了这个工具。 我花了 48 小时构建了这个工具,以弥补这个特定的不足:输入您的地址,即可获得 NWS 警报区域是否覆盖该区域的“是/否”答案,您的 Genasys 疏散区域,今晚您所在位置的风力+湿度,一份通俗易懂的行动清单,东湾学区的每所学校的决策视图,以及一个用于在晚上 10:30 给住在山丘上的邻居发送一键式 iMessage 好友检查模板。