在 0..1 之间将 u64 转换为 f64
作者:BlueOyster 提问时间:11/17/2023
我需要一个非常快速的伪随机数生成器来处理我一直在做的项目。到目前为止,我已经实现了 xorshift 算法,可以生成伪随机 u64。但是,我需要将这些 u64 转换为 0 到 1 之间的浮点值。 我...
simd 问答列表
作者:BlueOyster 提问时间:11/17/2023
我需要一个非常快速的伪随机数生成器来处理我一直在做的项目。到目前为止,我已经实现了 xorshift 算法,可以生成伪随机 u64。但是,我需要将这些 u64 转换为 0 到 1 之间的浮点值。 我...
作者:fredoverflow 提问时间:6/27/2012
哪些头文件为不同的 x86 SIMD 指令集扩展(MMX、SSE、AVX 等)提供了内部函数?在网上似乎不可能找到这样的列表。如果我错了,请纠正我。...
作者:Alex Radwan 提问时间:11/6/2023
我正在尝试通过 pip 使用 CPU 优化安装 numpy,但我不确定我是否正确安装了优化。 根据这里的文档,我正在运行这个 pip install --no-cache-dir --global...
作者:Rasmus 提问时间:10/24/2023
我正在对一些高性能数值代码进行矢量化,我注意到使用 Intel 的 SSE、AVX 和 AVX512 指令的 SIMD 矢量化性能与笔记本电脑上矢量寄存器的长度不成比例。我的笔记本电脑有 Tiger ...
作者:Gendai 提问时间:11/2/2023
我正在做一个项目,我第一次尝试使用矢量化来加快计算时间。 总体思路是给出一个足够大的数组,应用一些按位掩码,并计算具有位奇偶校验的uint16_t数。 以下代码是检查性能的测试用例,它生成给定大小的随...
作者:aganm 提问时间:10/30/2023
我有这个 AVX2 代码,我正在尝试将其扩展到 AVX-512: _mm256_permute4x64_epi64(a, _MM_SHUFFLE(3, 1, 2, 0)); 扩展代码如下所示: ...
作者:John Smith 提问时间:10/26/2023
我有一些基本的 SSE 知识,并编写了一些加速函数。但是这个问题让我难住了,我想知道是否真的有一种加速的 SIMD 方法来处理它。 我有一张包含 3 个颜色通道的图像。每个颜色通道的宽度高达 16 ...
作者:bluetooth16 提问时间:10/24/2023
我正在使用 SSE2 在 C++ 中编写 YUV420p 到 RGBA 颜色转换算法。现在,我有 YUV420p 到 RGB 和 RGB 到 RGBA。结果如下: size of image: 19...
作者:luqui 提问时间:10/22/2023
我在 MacOS Ventura 上链接操作时遇到问题。这是我最小的失败:std::experimental::simdclang++ #include <experimental/simd> u...
作者:Srihari S 提问时间:10/27/2023
我正在尝试使用 AVX512 代码。在进行相同的工作时,试图寻找类似于 AVX512 中_mm256_sign_epi8的功能,但无法找到等效的功能。如果我们找到类似的指令,那将非常有用。是否有等效指...