1作者: technoabsurdist7 个月前
我们构建了 Chisel,旨在实现无需硬件的 GPU 内核性能分析。它允许你运行 chisel profile kernel.cu 命令,并获得完整的 Nsight/Ncompute 或 rocprofv3 报告,而无需 GPU。<p>它会启动远程 H100、L40S 或 MI300X 机器(目前通过 DigitalOcean,但很快会扩展后端),运行你的代码,并返回详细的跟踪信息(内核计时、内存传输、API 调用等)。一切都基于 CLI,专为迭代开发而设计——每次运行的性能分析大约需要 1-2 分钟。<p>例如:<p># 在 H100 上使用 Nsight Systems 分析 PyTorch 训练脚本 chisel profile --nsys train.py<p># 使用系统跟踪在 MI300X 上分析 HIP 内核 chisel profile --rocprofv3=&quot;--sys-trace&quot; matrix_add.cpp<p>代码库:<a href="https:&#x2F;&#x2F;github.com&#x2F;Herdora&#x2F;chisel">https:&#x2F;&#x2F;github.com&#x2F;Herdora&#x2F;chisel</a> PyPI:pip install chisel-cli<p>欢迎反馈!特别是来自构建自定义内核、ML 层或底层 GPU 操作的开发者。
3作者: Fbue7 个月前
我今年17岁,最近推出了Biohack的私人测试版。这是一个扫描食品的工具,它会根据对衰老因素的影响(如炎症、Omega比例、毒素等)给出长寿评分。<p>目前还处于早期阶段,有些粗糙,但我希望得到关心健康寿命和深度营养的人的诚实反馈。<p>很想听听您的想法。
1作者: rco87867 个月前
OAuth 已经正式成为 MCP 规范的一部分有几周了。但到目前为止,我还没有看到任何实际应用的例子。想知道是否有人已经做过这方面的工作,或者知道有什么关于如何实现的、真正靠谱的文档。