gpu 问答列表

如何使用 ArrayFire 批量 2D 卷积

作者:Gustavo Stahl 提问时间:11/29/2022

通读 ArrayFire 文档,我注意到该库在使用 2D 卷积时支持批处理操作。因此,我需要使用 C++ API 将 N 个过滤器应用于图像。 为了便于测试,我决定创建一个简单的 Python 脚本...

浮点数的金属 SIMD 最小值和最大值操作失败

作者:TToi 提问时间:12/11/2018

问题简述 为什么我在 Metal 2.1 中使用浮点数从 Metal 2.1 中获得未定义的行为和函数?simd_minsimd_max 更新:似乎这只发生在 Radeon Pro 560X GP...

关于将数据从设备复制到主机时的推力::execution_policy

作者:huzzm 提问时间:9/6/2020

我曾经在多 GPU 系统中将数据从设备传输到主机。每个 GPU 都有一个大小相等的数据分区。使用 OpenMP,我在每台设备上调用该函数。在我目前的系统上,我正在使用 4 个 GPU。thrust::...

将 XGBoost 与 dask 分布式一起使用时出现值类型错误

作者:lara_toff 提问时间:1/19/2021

这是在我的机器上重现错误的代码: import numpy as np import xgboost as xgb import dask.array as da import dask.distr...

PyTorch head2head 模型中的CUDA_OUT_OF_MEMORY

作者:Mayank Tiwari 提问时间:3/5/2021

我正在执行 Github 存储库中提供的 head2head 模型。 当我使用以下命令运行代码时: ./scripts/train/train_on_target.sh Obama head2hea...

为什么在深度模型推理期间 GPU-Util 为零且 GPU 内存使用率高?

作者:SupernoobBran 提问时间:11/25/2021

背景 我目前正在从事一项需要深度学习模型推理(或预测)而不是训练任务的工作。我想在 GPU 上加速推理过程。 问题 我正在使用 tensorflow 中的 keras 模块为 MNIST 数字分...

防止 (GPU) 优化方法(如 gmpy2 和 numba)中大整数溢出

作者:Eldar Sultanow 提问时间:1/11/2022

我正在尝试检查一个大整数是否是完美的平方,在 JIT 修饰(优化)例程中使用。此处的示例仅用于说明目的(从理论角度来看,此类方程或椭圆曲线可以得到不同/更好的处理)。我的代码似乎溢出了,因为它产生了不...

cub::D eviceRadixSort 在指定结束位时失败

作者:huzzm 提问时间:2/27/2022

我正在使用 CUB 库的 GPU 基数排序算法对 N 个 32 位无符号整数进行排序,这些整数的值都只利用其 32 位中的 k,从最低有效位开始。 因此,我在调用 cub::D eviceRadix...

ArrayFire (C++): 'gfor' dim_t循环中的参数变化 / PARTIAL unwrap() 函数

作者:Jack Wells 提问时间:3/13/2022

如果有人能够帮助我解决这个问题,非常感谢。 我最近开始使用ArrayFire C++ Matrix库,发现它很棒,但是我遇到了一个我无法通过文档和/或在线搜索解决的问题。 简单地说,我需要创建的函数...

XGBoost 模型:在 GPU 上训练,在没有 GPU RAM 分配的情况下在 CPU 上运行

作者:S.V 提问时间:12/4/2020

如何在 GPU 上训练 XGBoost 模型,但在 CPU 上运行预测而不分配任何 GPU RAM? 我的情况:我在 Python 中创建了一个 XGBoot 模型 (),然后在 GPU 上训练它,...


共40条 当前第3页