1 分•作者: rbanffy•9 个月前
返回首页
最新
1 分•作者: ycosynot•9 个月前
1 分•作者: jason66•9 个月前
1 分•作者: PaulHoule•9 个月前
2 分•作者: pyman•9 个月前
1 分•作者: runningmike•9 个月前
1 分•作者: kirito1337•9 个月前
你认为内存损坏漏洞是怎么产生的?是由于 C/C++ 等低级语言造成的,还是仅仅是技术问题?
我们真的应该切换到 Rust 吗?
我个人认为没必要。
1 分•作者: doener•9 个月前
1 分•作者: technoabsurdist•9 个月前
嘿,HN!我们正在构建一个用于机器学习推理的性能分析器,它可以真正显示硬件层发生了什么,而无需手动解析火焰图,或设置 nsys 和 ncu。
问题:当前的 ML 性能分析器要么转储太多数据(torch.profiler),要么抽象掉您需要的细节。您无法看到您的模型实际上为什么慢——是内存带宽?内核启动开销?缓存未命中?
我们的方法:我们正在逆向工程 GPU 执行,从 Python 操作追踪到 PTX 指令。一个装饰器为您提供完整的执行图,并突出显示实际的瓶颈。
技术细节:
* 追踪 Python → CUDA 内核 → PTX,并进行时间分解
* 显示内存访问模式和带宽利用率
* 内核占用率和调度分析
* 适用于 PyTorch/JAX,TensorFlow 正在开发中
我们使用它来优化 Llama 推理,并发现了以前无法看到的瓶颈——获得了 50% 以上的加速:[https://www.herdora.com/blog/the-overlooked-gpu](https://www.herdora.com/blog/the-overlooked-gpu)
免费 Beta 版,提供 10 小时的性能分析:[https://keysandcaches.com](https://keysandcaches.com)
Github: [https://github.com/Herdora/kandc](https://github.com/Herdora/kandc)
文档: [https://www.keysandcaches.com/docs](https://www.keysandcaches.com/docs)
很好奇其他人正在遇到哪些当前工具无法诊断的推理瓶颈。您对现有性能分析器的体验如何?听取社区的意见将非常有帮助 :)
21 分•作者: flabber•9 个月前
1 分•作者: transpute•9 个月前
1 分•作者: johnsillings•9 个月前
1 分•作者: irish_coder•9 个月前
你需要设置 API 密钥才能运行它。
如果你不想花时间设置,只想听听输出结果;我已经在这里上传了一个示例音频 - <a href="https://soundcloud.com/irish_coder/youfm-example" rel="nofollow">https://soundcloud.com/irish_coder/youfm-example</a>
该应用程序的工作原理如下:
1. 通过用户界面收集有关用户兴趣和偏好的信息
2. 收集今天的最新新闻文章
3. 收集用户所在地的天气信息
4. 使用 Gemini flash 2.5 根据用户的潜在兴趣对新闻文章进行排序
5. 使用 Gemini Pro 2.5 根据收集到的所有信息创建自定义播客脚本
6. 使用 ElevenLabs TTS 生成音频
该项目还处于早期阶段。使用了 Cursor、Claude 4 和 Gemini。目前还比较粗糙。
我接下来想添加的功能...
- 命令行界面
- 安排任务的能力
- 更多来源,如 RSS、Reddit 等
- 改进用户界面
1 分•作者: merryace•9 个月前
这是一个能够帮助人类在第三次世界大战中生存下来的方法。普京几年前曾说过,一些在俄罗斯去世的人正在研究一种比核武器强大得多的武器。我当时认为这可能是一种威力巨大的炸弹。所以我提出了这个想法:一个可以分裂成独立舱体的地堡,这些舱体可以发射并逃离地球大气层,甚至飞出轨道,然后在太空中重新组合成一个空间站。我们需要携带动植物,以创建一个可持续的生态系统。
1 分•作者: imseantang•9 个月前
Hi HN!
我开发了 TimerMe - 一个简单的效率计时器,专注于做好一件事。
GitHub: <a href="https://github.com/imseantang/timerme" rel="nofollow">https://github.com/imseantang/timerme</a>
在线体验: <a href="https://www.timerme.com" rel="nofollow">https://www.timerme.com</a>
## 它的亮点:
*动态主题系统* - 整个用户界面(包括网站图标!)瞬间改变颜色。使用 CSS 自定义属性构建,实现无缝主题切换。
*多种计时器类型* - 预设时长的倒计时计时器、带圈速记录的精准秒表,以及多时区世界时钟。
*快速轻量* - 使用 HonoX (Hono + Vite) 部署在 Cloudflare Pages 上。客户端除了交互式组件外,没有使用 JavaScript 框架。
*智能世界时钟* - 自动检测您的时区,显示一天中的时间指示(上午/下午/晚上),并包含国家/地区标志。
## 技术决策:
- *Islands 架构* - 只有计时器/秒表组件在客户端进行水合,其他所有内容都是静态的。
- *SEO 友好的 URL* - 每个计时器时长都有自己的路径 (`/timer/25`, `/timer/5` 等),以便更好地被发现。
- *核心功能没有外部依赖* - 使用 Web Audio API 实现计时器声音。
- *移动优先响应式设计* - 使用 Flexbox 顺序属性在小屏幕上重新排列布局。
## 为什么我开发了这个:
找不到完全符合我需求的计时器工具,所以我就自己开发了一个。
## 试用一下:
- *25 分钟番茄工作法*: <a href="https://www.timerme.com/timer/25" rel="nofollow">https://www.timerme.com/timer/25</a>
- *5 分钟休息*: <a href="https://www.timerme.com/timer/5" rel="nofollow">https://www.timerme.com/timer/5</a>
- *秒表*: <a href="https://www.timerme.com/stopwatch" rel="nofollow">https://www.timerme.com/stopwatch</a>
- *世界时钟*: <a href="https://www.timerme.com/world-clock" rel="nofollow">https://www.timerme.com/world-clock</a>
网站图标随主题变化的功能实现起来可能最有趣 - 必须协调 SVG 资源与 CSS 自定义属性系统。
这个项目我花了几个周末的时间来开发。 欢迎大家对用户体验或技术方法提出反馈!
技术栈:HonoX, TypeScript, Tailwind CSS, Cloudflare Pages
1 分•作者: kaonwarb•9 个月前
3 分•作者: saucetest•9 个月前
2 分•作者: flanged•9 个月前
1 分•作者: gillh•9 个月前
1 分•作者: adelementary•9 个月前