AVX2 问答列表

C++ 错误:未在作用域中声明内部函数

作者:terdev 提问时间:5/28/2022

我想编译使用内部函数的代码(返回 8 个打包双字整数的向量)。以下是从头文件中截取的受影响函数的减少截图:_mm256_undefined_si256() // test.hpp #include ...

AVX2 _mm256_cmp_pd返回数字值

作者:Vladislav Kogan 提问时间:11/15/2022

我的目标是将比较矢量化,以便将来将它们用作掩码。 问题是 _mm256_cmp_pd 返回 NaN 而不是 1.0。在 AVX2 中进行比较的正确方法是什么? AVX2 代码: __m256d ...

如何将 8 个打包的 32 位整数(在一个 __m256i)的 +-1 个符号打包成 64 位整数的字节?

作者:Serge Rogatch 提问时间:8/20/2023

给定一个打包的 32 位有符号整数,如果原始的相应 32 位有符号整数大于或等于 0,如何获得每个字节的单个 64 位数字,如果该 32 位整数为负数?__m256i1__m256i-1 AVX2(...

如何有效地链接 avx2 内部函数以执行算术运算链?

作者:Stef1611 提问时间:9/7/2023

我写了一个大型程序来模拟分子系统。我在处理器是 Intel(R) Core(TM) i7-6700 CPU @ 3.40GHz 的台式计算机上运行它。大多数时间 (75%) 用于计算 4 个邻居的 L...

如何在 AVX256 中对齐/旋转 2 位矢量?

作者:cyborgdennett 提问时间:10/18/2023

我正在使用 AVX2 内部函数,并希望获得以下内容: 输入:[1,2,3,4,5,6,7,8] 输出:[8,1,2,3,4,5,6,7] 以下内容适用于 128 位向量: let vec1 =...

为什么 FMA x86 MS C 编译器的 AVX2 速度会变慢?

作者:Martin Brown 提问时间:10/29/2023

这是求解开普勒方程的三个经典启动器,S3 提供了一个有趣的示例,即具有奇怪时序行为的看似短的代码片段。这个问题涉及在 Microsoft C 编译器 x86 模式下编译它们,其中观察到异常行为 - 即...

从位位置的整数数组中设置/获取 1 位__m256i向量

作者:user2052436 提问时间:11/3/2023

设置位: 给定一个数组,其中每个都是范围内的 1 位位置(并且都是排序且唯一的),我需要将相应的位设置为 1。int inds[N]inds[i][0, 255]inds[i]__m256i 有没...


共7条 当前第1页