1 分•作者: typingcyclist•7 个月前
返回首页
最新
9 分•作者: jackgavigan•7 个月前
2 分•作者: volted•7 个月前
1 分•作者: austinallegro•7 个月前
1 分•作者: rbanffy•7 个月前
1 分•作者: technoabsurdist•7 个月前
我们构建了 Chisel,旨在实现无需硬件的 GPU 内核性能分析。它允许你运行 chisel profile kernel.cu 命令,并获得完整的 Nsight/Ncompute 或 rocprofv3 报告,而无需 GPU。<p>它会启动远程 H100、L40S 或 MI300X 机器(目前通过 DigitalOcean,但很快会扩展后端),运行你的代码,并返回详细的跟踪信息(内核计时、内存传输、API 调用等)。一切都基于 CLI,专为迭代开发而设计——每次运行的性能分析大约需要 1-2 分钟。<p>例如:<p># 在 H100 上使用 Nsight Systems 分析 PyTorch 训练脚本
chisel profile --nsys train.py<p># 使用系统跟踪在 MI300X 上分析 HIP 内核
chisel profile --rocprofv3="--sys-trace" matrix_add.cpp<p>代码库:<a href="https://github.com/Herdora/chisel">https://github.com/Herdora/chisel</a>
PyPI:pip install chisel-cli<p>欢迎反馈!特别是来自构建自定义内核、ML 层或底层 GPU 操作的开发者。
2 分•作者: petethomas•7 个月前
2 分•作者: thoughtpeddler•7 个月前
1 分•作者: rb2e•7 个月前
1 分•作者: presson•7 个月前
2 分•作者: lastdong•7 个月前
4 分•作者: Bluestein•7 个月前
2 分•作者: bernaforcillo•7 个月前
3 分•作者: Fbue•7 个月前
我今年17岁,最近推出了Biohack的私人测试版。这是一个扫描食品的工具,它会根据对衰老因素的影响(如炎症、Omega比例、毒素等)给出长寿评分。<p>目前还处于早期阶段,有些粗糙,但我希望得到关心健康寿命和深度营养的人的诚实反馈。<p>很想听听您的想法。
18 分•作者: conductor•7 个月前
12 分•作者: ulrischa•7 个月前
6 分•作者: angadh•7 个月前
36 分•作者: todsacerdoti•7 个月前
1 分•作者: rco8786•7 个月前
OAuth 已经正式成为 MCP 规范的一部分有几周了。但到目前为止,我还没有看到任何实际应用的例子。想知道是否有人已经做过这方面的工作,或者知道有什么关于如何实现的、真正靠谱的文档。
1 分•作者: mooreds•7 个月前