nsight-compute 问答列表

使用 CUDA 手册的车顶线模型与 Nsight 计算

作者:Cherry Toska 提问时间:7/13/2023

我有一个非常简单的矢量加法内核,为CUDA编写。 我想计算这个内核的算术强度和 GFLOP/s。 我计算的值与 Nsight Compute 的屋顶线分析部分获得的值明显不同。 由于我有一个非常简单...

为什么“torch.profiler”在与 ncu 共同运行时没有捕获 cuda 操作

作者:rd142857 提问时间:11/17/2023

我已将我的模型和输入绑定到 cuda x = torch.randint(low=0, high=256, size=(1, 3, 224, 224), dtype=torch.float32).t...


共2条 当前第1页