1作者: ardakaan9 个月前
嘿,HN,我是 Arda,是 heycustomer.co 的开发者——一个微型 SaaS,它用类似 WhatsApp 的干净、人性化的通知取代了烦人的弹窗。<p>我们开发它的原因是因为弹窗太糟糕了。它们破坏用户体验,降低转化率,而且大多数访客会立即关闭它们。但是,像我们每天都会查看 100 次的聊天那样,采用微妙的通知方式呢?这实际上是有效的。<p>使用 heycustomer,您可以将网站消息转换为熟悉的、浮动的通知——欢迎语、限时促销或自定义链接——而不会破坏您的布局。<p>所有套餐均可享受 8 折优惠,使用代码 heymate20——年度套餐非常便宜。<p>欢迎提供关于产品、文案或氛围的反馈。
1作者: technoabsurdist9 个月前
我们构建了 Chisel,旨在实现无需硬件的 GPU 内核性能分析。它允许你运行 chisel profile kernel.cu 命令,并获得完整的 Nsight/Ncompute 或 rocprofv3 报告,而无需 GPU。<p>它会启动远程 H100、L40S 或 MI300X 机器(目前通过 DigitalOcean,但很快会扩展后端),运行你的代码,并返回详细的跟踪信息(内核计时、内存传输、API 调用等)。一切都基于 CLI,专为迭代开发而设计——每次运行的性能分析大约需要 1-2 分钟。<p>例如:<p># 在 H100 上使用 Nsight Systems 分析 PyTorch 训练脚本 chisel profile --nsys train.py<p># 使用系统跟踪在 MI300X 上分析 HIP 内核 chisel profile --rocprofv3=&quot;--sys-trace&quot; matrix_add.cpp<p>代码库:<a href="https:&#x2F;&#x2F;github.com&#x2F;Herdora&#x2F;chisel">https:&#x2F;&#x2F;github.com&#x2F;Herdora&#x2F;chisel</a> PyPI:pip install chisel-cli<p>欢迎反馈!特别是来自构建自定义内核、ML 层或底层 GPU 操作的开发者。