gpu知识经验-第3页-解网

作者：Gustavo Stahl 提问时间：11/29/2022

通读 ArrayFire 文档，我注意到该库在使用 2D 卷积时支持批处理操作。因此，我需要使用 C++ API 将 N 个过滤器应用于图像。为了便于测试，我决定创建一个简单的 Python 脚本...

作者：TToi 提问时间：12/11/2018

问题简述为什么我在 Metal 2.1 中使用浮点数从 Metal 2.1 中获得未定义的行为和函数？simd_minsimd_max 更新：似乎这只发生在 Radeon Pro 560X GP...

作者：huzzm 提问时间：9/6/2020

我曾经在多 GPU 系统中将数据从设备传输到主机。每个 GPU 都有一个大小相等的数据分区。使用 OpenMP，我在每台设备上调用该函数。在我目前的系统上，我正在使用 4 个 GPU。thrust::...

作者：lara_toff 提问时间：1/19/2021

这是在我的机器上重现错误的代码： import numpy as np import xgboost as xgb import dask.array as da import dask.distr...

作者：Mayank Tiwari 提问时间：3/5/2021

我正在执行 Github 存储库中提供的 head2head 模型。当我使用以下命令运行代码时： ./scripts/train/train_on_target.sh Obama head2hea...

作者：SupernoobBran 提问时间：11/25/2021

背景我目前正在从事一项需要深度学习模型推理（或预测）而不是训练任务的工作。我想在 GPU 上加速推理过程。问题我正在使用 tensorflow 中的 keras 模块为 MNIST 数字分...

作者：Eldar Sultanow 提问时间：1/11/2022

我正在尝试检查一个大整数是否是完美的平方，在 JIT 修饰（优化）例程中使用。此处的示例仅用于说明目的（从理论角度来看，此类方程或椭圆曲线可以得到不同/更好的处理）。我的代码似乎溢出了，因为它产生了不...

作者：huzzm 提问时间：2/27/2022

我正在使用 CUB 库的 GPU 基数排序算法对 N 个 32 位无符号整数进行排序，这些整数的值都只利用其 32 位中的 k，从最低有效位开始。因此，我在调用 cub：:D eviceRadix...

作者：Jack Wells 提问时间：3/13/2022

如果有人能够帮助我解决这个问题，非常感谢。我最近开始使用ArrayFire C++ Matrix库，发现它很棒，但是我遇到了一个我无法通过文档和/或在线搜索解决的问题。简单地说，我需要创建的函数...

作者：S.V 提问时间：12/4/2020

如何在 GPU 上训练 XGBoost 模型，但在 CPU 上运行预测而不分配任何 GPU RAM？我的情况：我在 Python 中创建了一个 XGBoot 模型（），然后在 GPU 上训练它，...