1 分•作者: ogviq•9 个月前
返回首页
最新
1 分•作者: T-A•9 个月前
1 分•作者: ardakaan•9 个月前
嘿,HN,我是 Arda,是 heycustomer.co 的开发者——一个微型 SaaS,它用类似 WhatsApp 的干净、人性化的通知取代了烦人的弹窗。<p>我们开发它的原因是因为弹窗太糟糕了。它们破坏用户体验,降低转化率,而且大多数访客会立即关闭它们。但是,像我们每天都会查看 100 次的聊天那样,采用微妙的通知方式呢?这实际上是有效的。<p>使用 heycustomer,您可以将网站消息转换为熟悉的、浮动的通知——欢迎语、限时促销或自定义链接——而不会破坏您的布局。<p>所有套餐均可享受 8 折优惠,使用代码 heymate20——年度套餐非常便宜。<p>欢迎提供关于产品、文案或氛围的反馈。
1 分•作者: anigbrowl•9 个月前
1 分•作者: Traces•9 个月前
1 分•作者: coffeecoder123•9 个月前
1 分•作者: ishaanbhagwat•9 个月前
1 分•作者: almost-exactly•9 个月前
1 分•作者: typingcyclist•9 个月前
9 分•作者: jackgavigan•9 个月前
2 分•作者: volted•9 个月前
1 分•作者: austinallegro•9 个月前
1 分•作者: rbanffy•9 个月前
1 分•作者: technoabsurdist•9 个月前
我们构建了 Chisel,旨在实现无需硬件的 GPU 内核性能分析。它允许你运行 chisel profile kernel.cu 命令,并获得完整的 Nsight/Ncompute 或 rocprofv3 报告,而无需 GPU。<p>它会启动远程 H100、L40S 或 MI300X 机器(目前通过 DigitalOcean,但很快会扩展后端),运行你的代码,并返回详细的跟踪信息(内核计时、内存传输、API 调用等)。一切都基于 CLI,专为迭代开发而设计——每次运行的性能分析大约需要 1-2 分钟。<p>例如:<p># 在 H100 上使用 Nsight Systems 分析 PyTorch 训练脚本
chisel profile --nsys train.py<p># 使用系统跟踪在 MI300X 上分析 HIP 内核
chisel profile --rocprofv3="--sys-trace" matrix_add.cpp<p>代码库:<a href="https://github.com/Herdora/chisel">https://github.com/Herdora/chisel</a>
PyPI:pip install chisel-cli<p>欢迎反馈!特别是来自构建自定义内核、ML 层或底层 GPU 操作的开发者。
2 分•作者: petethomas•9 个月前
2 分•作者: thoughtpeddler•9 个月前
1 分•作者: rb2e•9 个月前
1 分•作者: presson•9 个月前
2 分•作者: lastdong•9 个月前
4 分•作者: Bluestein•9 个月前