在 CUDA Thrust 中并行化向后传播:重构神经网络实现
作者:ha ze 提问时间:11/15/2023
描述: 我正在使用 CUDA Thrust 并行化神经网络实现,并在将向后传播功能集成到我的 Unit 类中时遇到问题,这是该实现的核心。代码在没有向后传播功能的情况下运行,但当包含时,生成失败,没有...
CUDA 问答列表
作者:ha ze 提问时间:11/15/2023
描述: 我正在使用 CUDA Thrust 并行化神经网络实现,并在将向后传播功能集成到我的 Unit 类中时遇到问题,这是该实现的核心。代码在没有向后传播功能的情况下运行,但当包含时,生成失败,没有...
作者:feesh 提问时间:1/25/2022
已关闭。这个问题需要细节或澄清。它目前不接受答案。 想改进这个问题吗?通过编辑这篇文章添加详细信息并澄清问题。 去年关闭。 改进此问题 运算符的实现似乎不对,但我不确定。 这是 https:/...
作者:Sean 提问时间:11/30/2012
当使用 multiple.h 和 .cu 文件编译静态库时,我得到一个未解析的 extern 函数。下面是一个复制错误的简短示例。 看来我无法先让 Nsight Eclipse Edition 编译...
作者:Vitality 提问时间:6/19/2013
我正在使用 CUDA,我创建了一个类来处理复杂的整数。int2_ 文件中的类声明如下:ComplexTypes.h namespace LibraryNameSpace { class int2...
作者:Pippo 提问时间:1/2/2013
我在使用 CUDA FFT 库时遇到了一些问题。 我将输入声明为 cuDoubleComplex,但编译器返回错误,指出此类型与 cufftComplex 类型的参数不兼容。在互联网上搜索了一番后,...
作者:user3786219 提问时间:7/18/2020
基本上,我的目标如下:我想使用 CUDA SDK 工具包创建一个程序,我想在安装了 NVIDIA GPU 和 NVIDIA 驱动程序但不需要 CUDA 工具包的系统上运行此程序。我的想法是静态链接 c...
作者:huzzm 提问时间:9/6/2020
我曾经在多 GPU 系统中将数据从设备传输到主机。每个 GPU 都有一个大小相等的数据分区。使用 OpenMP,我在每台设备上调用该函数。在我目前的系统上,我正在使用 4 个 GPU。thrust::...
作者:Agade 提问时间:3/30/2015
如果用两个单精度浮点来模拟双精度浮点,性能会是什么样子,能做得好吗? 目前,英伟达对支持双精度的特斯拉卡收取相当高的费用,这使您可以获得单精度性能的三分之一(值得注意的例外:Titan/Titan ...
作者:einpoklum 提问时间:12/16/2019
我有一个带有一些功能的库。我还有一个小工具,可以确保常规的 C++ 编译器看不到,因此可以编译这些函数。__host__ __device__#ifdef __CUDACC____host__ __d...
作者:Harshvardhan Chandirasekar 提问时间:1/25/2021
已关闭。这个问题需要细节或澄清。它目前不接受答案。 想改进这个问题吗?通过编辑这篇文章添加详细信息并澄清问题。 2年前关闭。 改进此问题 我正在尝试将库从 Linux 移植到 Windows,...