cuda 问答列表

永恒赋值运算符调用循环 C++ 模板类

作者:A_Man 提问时间:8/13/2020

我有一个矩阵类,其中包含其成员函数的子集, #ifndef _CMATRIX_CUH_ #define _CMATRIX_CUH_ #include <thrust/device_vector.h...

快速 int 到 float 转换

作者:tommsch 提问时间:2/7/2021

我正在使用 s 在 Cuda 中进行计算。由于 GPU 上没有足够的内存,因此我们将原始数据存储在 GPU 上。因此,在使用此数据之前,我必须将其转换为 s。 s 的数量不是那么大(大约 12k 和 ...

为 cuda 和非 cuda 编译器编写代码

作者:tommsch 提问时间:7/13/2023

问题:我们正在编写 Cuda 代码,这些代码也应该可以由非 cuda 编译器编译(我们使用:nvcc、gcc 和 clang。 由于 Cuda 需要这些注释,因此我们通过在每个相关文件中包含以下标头来...

如何修复 cuInit 失败 [已关闭]

作者:Gökhan KARAÖMEROĞLU 提问时间:11/15/2023

闭。此问题需要调试详细信息。它目前不接受答案。 编辑问题以包括所需的行为、特定问题或错误以及重现问题所需的最短代码。这将帮助其他人回答这个问题。 7天前关闭。 改进此问题 当我尝试启动我的 d...

将自定义数据类型与 Thrust Vectors 和 Cuda 一起使用时出现构建错误

作者:Peter Newman 提问时间:11/6/2023

我正在将 Thrust 向量用于 cuda 内核,并且我创建了自己的结构,因此我可以将所有数据一起传递,当我初始化自定义类型的主机向量时,我从 thrust 中得到构建错误。 向量的初始化: ho...

CUDA 1d 输入数组和 2d 输出数组

作者:Predrag Stojadinović 提问时间:11/14/2023

基本上,我需要向下查看一个 1D 整数列表(我甚至可以用于此),并且对于每次返回 5 个值的数组,然后将该数组放入 - 换句话说,我需要使用 1D 输入数组来生成 2D 输出数组 并且已经工作正常 -...

CUDA 和 MSVC 的编译错误:来自&lt;atomic&gt;未定义的标识符

作者:user725757 提问时间:11/13/2023

我正在使用 cl 作为主机编译器(Visual Studio 2019、MSVC v14.29.30133)进行 CUDA 项目。我遇到了与 CUDA 标准库中的 C++11 标头相关的错误。输入是<...

CUDA 39-2 总和扫描跳过元素

作者:Brisk4t 提问时间:11/13/2023

我需要实现 GPU Gems 3 第 39.2 章中的并行求和扫描,并对函数进行轻微修改,因为它使用变量。我似乎已经让它“工作”了,因为我可以看到每个第二个元素的正确总和。但是,替代元素正在变为“0”...

未定义对“cuMemAlloc_v2”的引用

作者:Nurlan Nazaraliyev 提问时间:8/27/2023

我需要修改linux rdma-core驱动,添加一些cuda相关的功能;首先。 我更改了驱动程序中的 CMake 文件以包含头文件。但是当我编译驱动程序时,出现错误cuMemAlloccuda.hu...

如何将 cudaArray 转换为 Torch 张量?

作者:rbaleksandar 提问时间:10/31/2023

我正在尝试使用 Torch 和 CUDA。到目前为止,使用我能够做到以下几点:torch::from_blob() #include <cuda_runtime.h> #include <torch...


共38条 当前第1页