如何使用 ArrayFire 批量 2D 卷积
作者:Gustavo Stahl 提问时间:11/29/2022
通读 ArrayFire 文档,我注意到该库在使用 2D 卷积时支持批处理操作。因此,我需要使用 C++ API 将 N 个过滤器应用于图像。 为了便于测试,我决定创建一个简单的 Python 脚本...
gpu 问答列表
作者:Gustavo Stahl 提问时间:11/29/2022
通读 ArrayFire 文档,我注意到该库在使用 2D 卷积时支持批处理操作。因此,我需要使用 C++ API 将 N 个过滤器应用于图像。 为了便于测试,我决定创建一个简单的 Python 脚本...
作者:TToi 提问时间:12/11/2018
问题简述 为什么我在 Metal 2.1 中使用浮点数从 Metal 2.1 中获得未定义的行为和函数?simd_minsimd_max 更新:似乎这只发生在 Radeon Pro 560X GP...
作者:huzzm 提问时间:9/6/2020
我曾经在多 GPU 系统中将数据从设备传输到主机。每个 GPU 都有一个大小相等的数据分区。使用 OpenMP,我在每台设备上调用该函数。在我目前的系统上,我正在使用 4 个 GPU。thrust::...
作者:lara_toff 提问时间:1/19/2021
这是在我的机器上重现错误的代码: import numpy as np import xgboost as xgb import dask.array as da import dask.distr...
作者:Mayank Tiwari 提问时间:3/5/2021
我正在执行 Github 存储库中提供的 head2head 模型。 当我使用以下命令运行代码时: ./scripts/train/train_on_target.sh Obama head2hea...
作者:SupernoobBran 提问时间:11/25/2021
背景 我目前正在从事一项需要深度学习模型推理(或预测)而不是训练任务的工作。我想在 GPU 上加速推理过程。 问题 我正在使用 tensorflow 中的 keras 模块为 MNIST 数字分...
作者:Eldar Sultanow 提问时间:1/11/2022
我正在尝试检查一个大整数是否是完美的平方,在 JIT 修饰(优化)例程中使用。此处的示例仅用于说明目的(从理论角度来看,此类方程或椭圆曲线可以得到不同/更好的处理)。我的代码似乎溢出了,因为它产生了不...
作者:huzzm 提问时间:2/27/2022
我正在使用 CUB 库的 GPU 基数排序算法对 N 个 32 位无符号整数进行排序,这些整数的值都只利用其 32 位中的 k,从最低有效位开始。 因此,我在调用 cub::D eviceRadix...
作者:Jack Wells 提问时间:3/13/2022
如果有人能够帮助我解决这个问题,非常感谢。 我最近开始使用ArrayFire C++ Matrix库,发现它很棒,但是我遇到了一个我无法通过文档和/或在线搜索解决的问题。 简单地说,我需要创建的函数...
作者:S.V 提问时间:12/4/2020
如何在 GPU 上训练 XGBoost 模型,但在 CPU 上运行预测而不分配任何 GPU RAM? 我的情况:我在 Python 中创建了一个 XGBoot 模型 (),然后在 GPU 上训练它,...