Simd 问答列表

x86-64 SIMD 机制“比较”8 位无符号整数,给出 +1 / 0 / -1 结果(符号)的向量?

作者:Vitali 提问时间:9/7/2023

假设我有两个无符号整数(8 位)打包寄存器 a 和 b。我想比较它们并返回 +1 表示 > b,0 表示 a=b,或返回 -1 表示< b。或者,距离也可以工作(即返回实际差值而不是 -1/+1)。 ...

静态函数用于具有外部链接的内联函数 - 同时尝试在内联函数中使用加载指令

作者:Srihari S 提问时间:9/13/2023

我最近在为我的工作使用 clang 编译器。我遇到了以下问题,我在gcc或msvc编译器中都没有遇到 test_newer.c:8:32: fatal error: static function ...

如何在 SVE Gather-Load 内部函数中处理具有 32 位通道寄存器的 64 位指针?

作者:ature 提问时间:9/27/2023

SVE 提供各种聚集加载内部函数。例如,加载到 .svuint32_t m = svld1_gather_u32_offset_u32(svbool_t pg, const uint32_t *bas...

分解位域的特殊用途指令 [已关闭]

作者:Dess 提问时间:9/28/2023

闭。此问题需要调试详细信息。它目前不接受答案。 编辑问题以包括所需的行为、特定问题或错误以及重现问题所需的最短代码。这将帮助其他人回答这个问题。 上个月关闭。 改进此问题 我有这个编码为 32...

如何使用 AVX512 转置 8x8 int64 矩阵

作者:Serge Rogatch 提问时间:9/30/2023

考虑 8 个包含矩阵行的 AVX512 寄存器,以便每个 64 位通道都是 8x8 矩阵的一个单元。如何在 C/C++ 中转置这样的矩阵? 到目前为止,我尝试过:8 个内在函数。它非常慢,并且大量使...

如何在 AVX256 中对齐/旋转 2 位矢量?

作者:cyborgdennett 提问时间:10/18/2023

我正在使用 AVX2 内部函数,并希望获得以下内容: 输入:[1,2,3,4,5,6,7,8] 输出:[8,1,2,3,4,5,6,7] 以下内容适用于 128 位向量: let vec1 =...


共36条 当前第4页