1作者: kirito13379 个月前
你认为内存损坏漏洞是怎么产生的?是由于 C/C++ 等低级语言造成的,还是仅仅是技术问题? 我们真的应该切换到 Rust 吗? 我个人认为没必要。
1作者: technoabsurdist9 个月前
嘿,HN!我们正在构建一个用于机器学习推理的性能分析器,它可以真正显示硬件层发生了什么,而无需手动解析火焰图,或设置 nsys 和 ncu。 问题:当前的 ML 性能分析器要么转储太多数据(torch.profiler),要么抽象掉您需要的细节。您无法看到您的模型实际上为什么慢——是内存带宽?内核启动开销?缓存未命中? 我们的方法:我们正在逆向工程 GPU 执行,从 Python 操作追踪到 PTX 指令。一个装饰器为您提供完整的执行图,并突出显示实际的瓶颈。 技术细节: * 追踪 Python → CUDA 内核 → PTX,并进行时间分解 * 显示内存访问模式和带宽利用率 * 内核占用率和调度分析 * 适用于 PyTorch/JAX,TensorFlow 正在开发中 我们使用它来优化 Llama 推理,并发现了以前无法看到的瓶颈——获得了 50% 以上的加速:[https://www.herdora.com/blog/the-overlooked-gpu](https://www.herdora.com/blog/the-overlooked-gpu) 免费 Beta 版,提供 10 小时的性能分析:[https://keysandcaches.com](https://keysandcaches.com) Github: [https://github.com/Herdora/kandc](https://github.com/Herdora/kandc) 文档: [https://www.keysandcaches.com/docs](https://www.keysandcaches.com/docs) 很好奇其他人正在遇到哪些当前工具无法诊断的推理瓶颈。您对现有性能分析器的体验如何?听取社区的意见将非常有帮助 :)
1作者: irish_coder9 个月前
你需要设置 API 密钥才能运行它。 如果你不想花时间设置,只想听听输出结果;我已经在这里上传了一个示例音频 - <a href="https://soundcloud.com/irish_coder/youfm-example" rel="nofollow">https://soundcloud.com/irish_coder/youfm-example</a> 该应用程序的工作原理如下: 1. 通过用户界面收集有关用户兴趣和偏好的信息 2. 收集今天的最新新闻文章 3. 收集用户所在地的天气信息 4. 使用 Gemini flash 2.5 根据用户的潜在兴趣对新闻文章进行排序 5. 使用 Gemini Pro 2.5 根据收集到的所有信息创建自定义播客脚本 6. 使用 ElevenLabs TTS 生成音频 该项目还处于早期阶段。使用了 Cursor、Claude 4 和 Gemini。目前还比较粗糙。 我接下来想添加的功能... - 命令行界面 - 安排任务的能力 - 更多来源,如 RSS、Reddit 等 - 改进用户界面
1作者: merryace9 个月前
这是一个能够帮助人类在第三次世界大战中生存下来的方法。普京几年前曾说过,一些在俄罗斯去世的人正在研究一种比核武器强大得多的武器。我当时认为这可能是一种威力巨大的炸弹。所以我提出了这个想法:一个可以分裂成独立舱体的地堡,这些舱体可以发射并逃离地球大气层,甚至飞出轨道,然后在太空中重新组合成一个空间站。我们需要携带动植物,以创建一个可持续的生态系统。
1作者: imseantang9 个月前
Hi HN! 我开发了 TimerMe - 一个简单的效率计时器,专注于做好一件事。 GitHub: <a href="https:&#x2F;&#x2F;github.com&#x2F;imseantang&#x2F;timerme" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;imseantang&#x2F;timerme</a> 在线体验: <a href="https:&#x2F;&#x2F;www.timerme.com" rel="nofollow">https:&#x2F;&#x2F;www.timerme.com</a> ## 它的亮点: *动态主题系统* - 整个用户界面(包括网站图标!)瞬间改变颜色。使用 CSS 自定义属性构建,实现无缝主题切换。 *多种计时器类型* - 预设时长的倒计时计时器、带圈速记录的精准秒表,以及多时区世界时钟。 *快速轻量* - 使用 HonoX (Hono + Vite) 部署在 Cloudflare Pages 上。客户端除了交互式组件外,没有使用 JavaScript 框架。 *智能世界时钟* - 自动检测您的时区,显示一天中的时间指示(上午/下午/晚上),并包含国家/地区标志。 ## 技术决策: - *Islands 架构* - 只有计时器/秒表组件在客户端进行水合,其他所有内容都是静态的。 - *SEO 友好的 URL* - 每个计时器时长都有自己的路径 (`/timer/25`, `/timer/5` 等),以便更好地被发现。 - *核心功能没有外部依赖* - 使用 Web Audio API 实现计时器声音。 - *移动优先响应式设计* - 使用 Flexbox 顺序属性在小屏幕上重新排列布局。 ## 为什么我开发了这个: 找不到完全符合我需求的计时器工具,所以我就自己开发了一个。 ## 试用一下: - *25 分钟番茄工作法*: <a href="https:&#x2F;&#x2F;www.timerme.com&#x2F;timer&#x2F;25" rel="nofollow">https:&#x2F;&#x2F;www.timerme.com&#x2F;timer&#x2F;25</a> - *5 分钟休息*: <a href="https:&#x2F;&#x2F;www.timerme.com&#x2F;timer&#x2F;5" rel="nofollow">https:&#x2F;&#x2F;www.timerme.com&#x2F;timer&#x2F;5</a> - *秒表*: <a href="https:&#x2F;&#x2F;www.timerme.com&#x2F;stopwatch" rel="nofollow">https:&#x2F;&#x2F;www.timerme.com&#x2F;stopwatch</a> - *世界时钟*: <a href="https:&#x2F;&#x2F;www.timerme.com&#x2F;world-clock" rel="nofollow">https:&#x2F;&#x2F;www.timerme.com&#x2F;world-clock</a> 网站图标随主题变化的功能实现起来可能最有趣 - 必须协调 SVG 资源与 CSS 自定义属性系统。 这个项目我花了几个周末的时间来开发。 欢迎大家对用户体验或技术方法提出反馈! 技术栈:HonoX, TypeScript, Tailwind CSS, Cloudflare Pages