CUDA 问答列表

在 CUDA Thrust 中并行化向后传播:重构神经网络实现

作者:ha ze 提问时间:11/15/2023

描述: 我正在使用 CUDA Thrust 并行化神经网络实现,并在将向后传播功能集成到我的 Unit 类中时遇到问题,这是该实现的核心。代码在没有向后传播功能的情况下运行,但当包含时,生成失败,没有...

为什么要以这种方式实现矩阵和向量的不等式?[关闭]

作者:feesh 提问时间:1/25/2022

已关闭。这个问题需要细节或澄清。它目前不接受答案。 想改进这个问题吗?通过编辑这篇文章添加详细信息并澄清问题。 去年关闭。 改进此问题 运算符的实现似乎不对,但我不确定。 这是 https:/...

具有多个 .h 和 .cu 文件的静态库无法解析函数

作者:Sean 提问时间:11/30/2012

当使用 multiple.h 和 .cu 文件编译静态库时,我得到一个未解析的 extern 函数。下面是一个复制错误的简短示例。 看来我无法先让 Nsight Eclipse Edition 编译...

PTXAS 文件中的 CUDA 外部类链接和未解析的 extern 函数

作者:Vitality 提问时间:6/19/2013

我正在使用 CUDA,我创建了一个类来处理复杂的整数。int2_ 文件中的类声明如下:ComplexTypes.h namespace LibraryNameSpace { class int2...

双精度 CUFFT

作者:Pippo 提问时间:1/2/2013

我在使用 CUDA FFT 库时遇到了一些问题。 我将输入声明为 cuDoubleComplex,但编译器返回错误,指出此类型与 cufftComplex 类型的参数不兼容。在互联网上搜索了一番后,...

cuda 分离编译模式和 cudart 静态链接的链接错误

作者:user3786219 提问时间:7/18/2020

基本上,我的目标如下:我想使用 CUDA SDK 工具包创建一个程序,我想在安装了 NVIDIA GPU 和 NVIDIA 驱动程序但不需要 CUDA 工具包的系统上运行此程序。我的想法是静态链接 c...

关于将数据从设备复制到主机时的推力::execution_policy

作者:huzzm 提问时间:9/6/2020

我曾经在多 GPU 系统中将数据从设备传输到主机。每个 GPU 都有一个大小相等的数据分区。使用 OpenMP,我在每台设备上调用该函数。在我目前的系统上,我正在使用 4 个 GPU。thrust::...

在 GPU 上使用 2 个 FP32 模拟 FP64

作者:Agade 提问时间:3/30/2015

如果用两个单精度浮点来模拟双精度浮点,性能会是什么样子,能做得好吗? 目前,英伟达对支持双精度的特斯拉卡收取相当高的费用,这使您可以获得单精度性能的三分之一(值得注意的例外:Titan/Titan ...

分离库的主机端和 CUDA 设备端版本

作者:einpoklum 提问时间:12/16/2019

我有一个带有一些功能的库。我还有一个小工具,可以确保常规的 C++ 编译器看不到,因此可以编译这些函数。__host__ __device__#ifdef __CUDACC____host__ __d...

无法解决将一个库(基于 C++)链接到另一个库(基于 CUDA)时LNK2019和LNK2021错误 [已关闭]

作者:Harshvardhan Chandirasekar 提问时间:1/25/2021

已关闭。这个问题需要细节或澄清。它目前不接受答案。 想改进这个问题吗?通过编辑这篇文章添加详细信息并澄清问题。 2年前关闭。 改进此问题 我正在尝试将库从 Linux 移植到 Windows,...


共38条 当前第3页