AVX512 问答列表

如何使用 AVX512 转置 8x8 int64 矩阵

作者:Serge Rogatch 提问时间:9/30/2023

考虑 8 个包含矩阵行的 AVX512 寄存器,以便每个 64 位通道都是 8x8 矩阵的一个单元。如何在 C/C++ 中转置这样的矩阵? 到目前为止,我尝试过:8 个内在函数。它非常慢,并且大量使...

静态函数用于具有外部链接的内联函数 - 同时尝试在内联函数中使用加载指令

作者:Srihari S 提问时间:9/13/2023

我最近在为我的工作使用 clang 编译器。我遇到了以下问题,我在gcc或msvc编译器中都没有遇到 test_newer.c:8:32: fatal error: static function ...

AVX512 使用的直方图制作

作者:bjasku99 提问时间:9/13/2023

我第一次尝试使用 avx512 指令并行实现直方图。 我的数据集是一个数组,其中包含从 0 到 255 的整数。(数组是对齐的),所以我的最终直方图数组包含 256 int,它应该表示每个亮度的像素数...

_mm512_mask_loadunpacklo_epi32是什么意思?

作者:AoShen 提问时间:9/12/2023

我是 AVX-512 的初学者,当我阅读开源程序的源代码时,我发现了以下代码: __m512i vecData1; __mmask16 vecMask; int32_t *addrF = (int3...

x86-64 SIMD 机制“比较”8 位无符号整数,给出 +1 / 0 / -1 结果(符号)的向量?

作者:Vitali 提问时间:9/7/2023

假设我有两个无符号整数(8 位)打包寄存器 a 和 b。我想比较它们并返回 +1 表示 > b,0 表示 a=b,或返回 -1 表示< b。或者,距离也可以工作(即返回实际差值而不是 -1/+1)。 ...

编译 Rust 代码时是否缺少 AVX512 的目标功能?

作者:Chris 提问时间:9/2/2023

我编写了一些使用 AVX2 和 AVX512 指令来加速图像合成的 Rust 函数。我使用的是 AMD 7950x CPU。 当我运行时,我得到:RUSTFLAGS="-C target-cpu=n...

GCC 在使用 clang 时抛出错误,工作正常_mm512_permutevar_epi32

作者:Mr. Noob 提问时间:8/20/2023

我从 GCC 编译器收到此错误 - 错误:没有依赖于模板参数的“_mm512_permutevar_epi32”参数,因此“_mm512_permutevar_epi32”的声明必须可用 [-fpe...


共17条 当前第2页